AI模型与长尾知识

不能过于迷信依靠AI模型自身能力解决问题。几个顶流AI水平高是高，但主要体现在语言与思维能力。它们掌握的世界知识，其实仅仅是人类文明史里极少数意义重大的知识。还有浩如烟海的长尾知识，散落在数字世界的各个角落。这些知识既难以规整成数据集，AI也无法跟上它指数级增长的生产速度。

以这个芒果胚根的问题为例，这是典型的长尾知识。我分别测了Claude、GPT-3.5、Bard。其中由于Bard有联网能力，表现反而优于模型自身能力更强的Claude和GPT-3.5。这里的关键在于，我指定让Bard“搜索网络后回答”，它从网络中得到了正确的长尾知识。

那如果让Claude和GPT-3.5采用同样策略，放弃用自己有限的知识猜测推理，转而总结人类生产的长尾知识，表现会不会有提升呢？目前Claude和GPT-3.5官方并没有联网的能力，但办法也是有的。就是这个浏览器插件：Maxai。

https://chrome.google.com/webstore/detail/maxaime-use-chatgpt-ai-an/mhnlakgilnojmhinhkckjpncpbhabphi

它自己实现了搜索的部分，然后把搜索得来的几条结果让AI总结，现在结果大致令人满意了。只是我不太清楚这个插件挑选搜索结果的逻辑，它的准确度不如专业的搜索引擎（我在后来的几项其他测试中验证了这一点），Claude和GPT-3.5被一些无关信息干扰或误导，产生的结果仍然比不上Bard。确实，Bard在搜索能力上的优势无可比拟。

Claude和GPT-3.5的现在结果大致令人满意了。

研究了插件原理，从Claude的聊天记录里可以发现，这个插件从搜索引擎的结果列表里取了前6条，把它们的标题和摘要传给AI让它总结。需要注意的是，插件仅仅取了搜索列表页的信息，没有到各个链接里取正文内容。所以它传递给AI的信息量非常有限，被搜索引擎先提炼过一道了。因此Claude和GPT-3.5在一些问题上表现仍然不如Bard（我在后来的几项其他测试中验证了这一点），我猜测Bard在获取网络信息时采用了与之不同的方式。

AI模型的立足之本是对语言的理解，当然，这里的语言是广义的，不仅仅限于人类的自然语言。它通过语言理解一切，与生物的多种立体感官系统感知世界的方式截然不同。从这个角度看，AI对世界的理解能达到今天的高度，是令人惊叹的。

然而，不能指望AI自身能力能解决一切问题，不，出到GPT-500都不可能。这是我看到的许多对AI不甚了解又满怀期待的老板们的认知误区。作为人，想要用好AI，让它真正成为人类的好帮手，正确的方向是，积极地让AI与真实世界连接起来。训练数据总会有截止时间，但它感知世界的渠道和方式可以无尽扩展。连接网络是极其重要的一步，但实际上只是第一步，后面的路，尽管放开胆想象。目前能看到的是，多模态能力的大发展，正在为未来铺路。