左手AI右手Agent - 百度上线AI搜,提问不缺灵感了
我发现我区分不开 AI 搜索和 AI 对话了,
最近两天做了一份24年 AI 应用合集,做到通用 AI 和 AI 搜索这两个分类的时候,发现越来越多通用 AI 支持上了联网搜索,理论上应该叫 AI 搜索了吧。
但他们跟原生做 AI 搜索那几家的体验又有不同,没法放在同一个维度上测试。
单次搜索的话,原生AI搜索会先理解用户输入的问题,再进行搜索总结,相当于一步走了通用 AI 好几轮。这带来的缺点就是多轮对话表现不佳,大部分在2-3轮之后就会忘掉你之前的提问。
所以我决定尝试一下能不能构建一个简单的评测标准,让普通用户也能一下子挑出适合自己的 AI 搜索。
目前市面上的AI搜索产品主要有三类,除了上面提到的原生 AI搜索(Perplexity、秘塔AI、Felo、Genspark等)、通用大模型+联网搜索(SearchGPT、Kimi、豆宝、元宝等),其实还有一类:
本该背靠传统搜索,理论上能轻松做出最强的AI搜索的三家(New Bing、Google AI Overview、百度 AI 搜)。
前两家里,New Bing基本上成为了 SearchGPT 调用搜索 API的供应商、Google AI Overview 把 AI 搜索放在搜索结果最顶端,可惜将传统搜索和 AI 搜索放在同一个界面反而会分散我的注意力。
所以当我看到百度做出一份不同的答卷,将 AI 搜索单独做出一个新的页面,为提升搜索质量还把广告拔除了。我就知道今天应该借着构建新评估标准的同时,来好好测测这个赛道的新选手了。
使用地址🔗:chat.baidu.com
这次的评估标准从三种类型的 AI 搜索都能找到的共同点出发,挑选一款足够优秀的 AI 搜索主要分三个维度: "提问体验"、“回复效果”、“Agent功能集成”。
三个维度对应的是整个提问过程的三个阶段,“提问前”、“提问过程”、“提问后处理” 。
一、提问体验
自从 AI 搜索开始抢占传统搜索的流量的时候,
搜索问题的形态已经发生了变化。
回忆一下,过去的搜索是我先想好自己要搜的东西,然后在关键词之间加上空格,高级一点就在长一点的关键词加上双引号“”,比方说 Python 使用教程、wins photoshop 安装等等。
AI搜索的场景下,问题变长了两倍以上。
以前提问的形式会更加贴合自然语言,如“我想学 python,但我不知道从哪里开始”、“我要给 wins 电脑安装上 PS 的 AI 版本”。
但目前 AI 要从一大堆话里面准确提取出我们真正想问的还有一段距离,等上个10来秒才发现得到的回答不是自己想要的,实在有点难受。
百度AI搜就上线了一个功能:
灵感激发
当我提问如何学习 python 的时候,注意 AI 搜不是按照左侧的搜索结果来总结大纲,也不是追问,而且按照学习的时间轴生成出了结构化的知识体系。
灵感搜索这个功能定位是分析问题的全貌,形成结构化的知识脉络结果,辅助用户深入搜索。这样的好处是在原生 AI 搜索里面,追平了通用 AI 的多轮对话的优势,能省下无效的提问,在有效的上下文里得到更多有效信息。
二、回复效果
验证了 AI 搜的提问体验后,就来到了AI搜索的硬实力考研关卡,也是我从传统搜索跳到AI搜索的决定性因素。
一个词总结的话就是“快准稳”,回复速度是否足够快。因为回答时间超过10s的话,一旦回复错误,就很容易会觉得还不如用传统搜索。
从演示视频中,我们可以看到,百度AI搜的响应速度蛮快,从输入问题到开始流式回答,基本上只用了2-3秒。
然后是回复内容是否准确,要是搜索10次里,超过3次的结果有问题,那就意味着我每次搜索要先根据自己的经验验证这份回复是不是正确的,再挨个点击信息源确认。这种情况在你搜索领域是一个全新领域的时候,简直是灾难(我都要一个个点开链接了,为啥不用传统搜索)。
这次,我挑选了三个需要总结大量网页的场景,分别是新闻总结、物品采购、旅游建议。每个问题都搜索10次,还会额外对比每次的信息源。以免模型作弊找到了已经总结好的内容。
最终AI搜索平均搜索内容准确率是80%左右,错误的20%里面有百分之95是信息缺失,只有5%是出现信息错误的,这对于一次性要跨网页,还要从多种内容里来总结来说,效果是我认可的。
提一句,回复服务是否足够稳定,这一点从我日常使用体验上看,除非是模型供应商,比方说OpenAI挂了的情况,大部分AI搜索都不需要担心这点。
三、Agent功能集成
另一个 AI 搜索有望超越传统搜索形态的功能点就是 Agents,
也就说是借助模型的多模态功能,在结果展示界面加入更丰富的内容维度(图片、视频、音频、文件),比如SearchGPT查询股票的时候会给出股票走势图;再比如搜索一首歌,会直接给出视频。
这个状态下的 AI 搜索就不局限于信息搜索了,更像一个信息处理平台,我可以列出大纲、思维导图、加工成ppt,形成专属的内容产出工作流。比方说,Perplexity推出的Pages,允许用户在搜索得到的答案转换成一篇博客,还支持插入相关的图片和视频。这些内容又将再次被收录。理论上用户产出的优质内容增加,才能打破现在AI内容对互联网的“污染”。
百度当然想到了这一点,所以 AI 搜上线就自带了信息再加工的功能。在对话输入框里提供了智能体入口,我可以直接通过“@”来与不同智能体进行交互。
先是文字的二次加工,
而且还能三次加工,把推文转成PPT(智能体足够多,优势也拉上来了,每次提问前可以先找找看有没有对应的智能体)
图片生成功能是内置在对话窗口里的,只需要表达出你想要生成图片即可。至于图片编辑功能,是集成了高清、扩图、换风格和去水印。
AI搜最大50MB支持图片、最大10MB文件和URL理解,这个容量用来做论文理解是舒适区。
我们一起来读读看初代GPT论文第一作者Alec Radford引用量最高的论文《Language models are few-shot leamers》来怀念一下这位大神,他也离开OpenAI了(吐槽一下OpenAI真的还有人吗……)
二次加工,才是我最看好AI搜索的能力。传统的搜索中,我们只能得到信息的内容,无论我们要进行任何处理,都需要跳出到其他平台。而AI搜索打破了这个壁垒,我们可以直接一站式完成基本的信息处理,而不是停留在第一步。
这才是AI时代的降本增效,也是我选择使用AI搜索的首要原因。
写在最后
Your shortcut to the world’s knowledge.
百度在过去一年给了我不少意外惊喜,
从自由画布将 AI 工具统一到一个操作界面,到百度网盘AI化,再到今天这款“AI搜”,都能感受到他们想将AI用在实处的目标。
其实,
将创意实际化,让技术落地,
正是下一步,
也是重要的一步。
@ 作者 / 卡尔 & 阿汤@ 动手学AI知识库 / learnprompt.pro
最后,感谢你看到这里👏如果喜欢这篇文章,不妨顺手给我们点赞👍|在看👀|转发📪更多的内容正在不断填坑中……