内容纲要
前面提到字节开放了国内版扣子,支持发布机器人到微信公众号。
最近尝试了一波,并将其接入了公众号。呃,不是本公众号,扣子目前只支持认证的服务号。从下图来看,目前效果不咋的啊。
扣子提供了创建知识库的功能。其实知识库的思路比较简单。用户先上传整理好的数据,然后系统将数据进行分割并存储在数据库中,在使用的过程中,大模型读取用户指令,然后在数据库中进行搜索,最后将搜索命中的数据进行整理并返回给用户。在整个过程中,有几个地方对结果影响比较大:
-
原始数据资料。资料信息的准确性会对后续的应用产生决定性的影响。 -
数据分割。分割算法有很多,有的按照文本内容自然段落及长度进行分割,也有一些使用大模型读取数据,在理解信息的基础上进行分割。数据分割结果会影响到后续的查询命中率及资料整理结果。 -
信息的读取与返回。这部分严重依赖于大模型能力。一些拉垮的模型甚至都无法理解用户输入的需求信息,更不要提对搜索到的信息进行理解并加工整理了。
测试的时候我加了几本书,内容没有整理。
然而我低估了云雀的拉垮程度,其无法识别文档中的公式信息和图片信息。这也直接导致后面在使用的过程中出现不连贯的碎片信息。
按照官网文档提供的方法配置公众号信息,可以将Bot发布到公众号中。不过这里只支持认证的服务号,我手边刚好有一个认证的服务号。
发布成功后,即可在公众号后台进行对话了。
反应比较慢,等了十几秒钟才出结果。
当然,这里只是简单的尝试,知识库只是随便上传了几本书。后面考虑将知识库精细处理一波,也许可以提升效果。
(完)
本篇文章来源于微信公众号: CFD之道
评论前必须登录!
注册