这几天我用了下AnythingLLM,简单的问题还行,复杂的、需要关联很多问题的完全不行,deepseek通用模型完全不了解本地资料中的信息,所以无法将一个问题拆分成几个合理的小问题然后到本地资料库中去寻找,要想彻底解决这个问题,就必须要进行本地模型的训练,但是这样成本就上去了,如果哪个公司能解决这个问题,必将会引爆一波AI的私有部署热潮。
【 在 sthgot2give 的大作中提到: 】
: 玩了几天,发现问题不是语言模型能干什么,而是工程化的集成。
: 在用户实际需求和语言模型之间,缺一个逻辑层,整合语言模型和业务逻辑。目前挺火的Agent和RAG就是做这个的,还需要集成一堆工具,包括网络内容提取、文件分析和矢量化、矢量数据库、视觉模型等等,最后整合一个工作流,才能真的干点实事。
: 但是这些都还在实验室状态,能用的几个工具,比如ChatBox和AnythingLLM都还简陋的很。
: ...................
--
FROM 113.233.201.*