- 主题:试了下deepseek,真受不了
有一种工具叫日历,用这种题问AI简直是浪费算力
--
FROM 106.121.141.*
人家是llm啊,它强化学习训练的是输出最有可能解决问题的字符串,另外ds多模态都做了个半吊子都还只能识别文字,我怀疑ds根本就没接入很多工具,你这测试方法不是浪费算力是什么。你这种测试应该测那种agent,最起码接管操作系统可以调用工具了再测,微软不是有那种可操作工具的llm框架嘛。现在ds最牛批的超过所有人类的知识容量和超大向量相关度计算,说人话就是你可以多问它点发散度高的问题别人不知道怎么答的问题,它往往能从某些角度给出惊艳的回答。问这种小儿科的问题本身就是用错了
【 在 wuduan 的大作中提到: 】
: 是不是浪费算力并不是我要讨论的事情
: 连小孩子都知道有日历这东西,但是人工“智能”不知道
--
FROM 106.121.141.*
你们这种人我见得多了,什么9.11和9.8谁大的,什么一个单词里面有几个r字母的,反正各种奇奇怪怪问题的。根本原因就是没有弄明白llm的能力边界在哪,它就是一个高维度非线性向量相关计算器以及基于某些聚类概率的生成器。但话说这就不是智能了吗?有没有可能,人类的智能也就不过如此,所谓“学富五车文思泉涌”,也不过是储存了大量知识,然后能丰富联想推断而已。
另外你说的那些什么AI不适合精确工作的,gpt canvas不是早就可以调用工具回答精确问题了吗,至少可以直接调用python而且可以当时运行并修改,你在这用重复测人家已经实现的功能有啥意义?
【 在 wuduan 的大作中提到: 】
: 跟你讨论这些没意义
: 你还是没看懂我说啥
:
--
FROM 106.121.141.*