不能过于迷信依靠AI模型自身能力解决问题。几个顶流AI水平高是高,但主要体现在语言与思维能力。它们掌握的世界知识,其实仅仅是人类文明史里极少数意义重大的知识。还有浩如烟海的长尾知识,散落在数字世界的各个角落。这些知识既难以规整成数据集,AI也无法跟上它指数级增长的生产速度。
以这个芒果胚根的问题为例,这是典型的长尾知识。我分别测了Claude、GPT-3.5、Bard。其中由于Bard有联网能力,表现反而优于模型自身能力更强的Claude和GPT-3.5。这里的关键在于,我指定让Bard“搜索网络后回答”,它从网络中得到了正确的长尾知识。
那如果让Claude和GPT-3.5采用同样策略,放弃用自己有限的知识猜测推理,转而总结人类生产的长尾知识,表现会不会有提升呢?目前Claude和GPT-3.5官方并没有联网的能力,但办法也是有的。就是这个浏览器插件:Maxai。
https://chrome.google.com/webstore/detail/maxaime-use-chatgpt-ai-an/mhnlakgilnojmhinhkckjpncpbhabphi
它自己实现了搜索的部分,然后把搜索得来的几条结果让AI总结,现在结果大致令人满意了。只是我不太清楚这个插件挑选搜索结果的逻辑,它的准确度不如专业的搜索引擎(我在后来的几项其他测试中验证了这一点),Claude和GPT-3.5被一些无关信息干扰或误导,产生的结果仍然比不上Bard。确实,Bard在搜索能力上的优势无可比拟。
Claude和GPT-3.5的现在结果大致令人满意了。
研究了插件原理,从Claude的聊天记录里可以发现,这个插件从搜索引擎的结果列表里取了前6条,把它们的标题和摘要传给AI让它总结。需要注意的是,插件仅仅取了搜索列表页的信息,没有到各个链接里取正文内容。所以它传递给AI的信息量非常有限,被搜索引擎先提炼过一道了。因此Claude和GPT-3.5在一些问题上表现仍然不如Bard(我在后来的几项其他测试中验证了这一点),我猜测Bard在获取网络信息时采用了与之不同的方式。
AI模型的立足之本是对语言的理解,当然,这里的语言是广义的,不仅仅限于人类的自然语言。它通过语言理解一切,与生物的多种立体感官系统感知世界的方式截然不同。从这个角度看,AI对世界的理解能达到今天的高度,是令人惊叹的。
然而,不能指望AI自身能力能解决一切问题,不,出到GPT-500都不可能。这是我看到的许多对AI不甚了解又满怀期待的老板们的认知误区。作为人,想要用好AI,让它真正成为人类的好帮手,正确的方向是,积极地让AI与真实世界连接起来。训练数据总会有截止时间,但它感知世界的渠道和方式可以无尽扩展。连接网络是极其重要的一步,但实际上只是第一步,后面的路,尽管放开胆想象。目前能看到的是,多模态能力的大发展,正在为未来铺路。