- 主题:grok3 有人测试过吗?也会犯国内模型犯过的错啊
ds联网能用了?不联网我是没发现比4o好用
【 在 updatedq (updatedq) 的大作中提到: 】
: 这不很正常吧
:
: 试了很久,发现如果日常使用的话,deepseek更好用,比gpt o3-mini也好用,特别是联网搜索的时候。
:
--
FROM 117.133.82.*
用thinking答案没问题
【 在 Alohaaaa (Alohaaaa) 的大作中提到: 】
:
: --
:
: ※ 来源:·水木社区
--
FROM 117.133.82.*
我发现和语言有很大关系,用英语问gemini和grok都回答正确,不需要思考,ds用藏语问回答就是3.11更大,但是中文就没问题
【 在 Alohaaaa (Alohaaaa) 的大作中提到: 】
: 你说的确实有道理
: deepseek 也考虑到这一层了
: 【 在 heideggerr 的大作中提到: 】
: : 这种大小比较可能是隐含的,当人们问3.11比3.9多了哪些功能的时候,作为LLM就模糊地领会到3.11是一个比3.9大的东西了,或者换句话说,集合论中集合之间的“大”、“小”和数字空间中的数字之间的“大”、“小”在大模型中是同构的、甚至是同一个东西,所以当人们大量地问3.11比3.9多了哪些功能的时候,集合空间中的“大”、“小”关系就会污染了数字空间中的“大”、“小”关系。
--
FROM 117.133.82.*