grok3 有人测试过吗？也会犯国内模型犯过的错啊

水木社区手机版

主题:grok3 有人测试过吗？也会犯国内模型犯过的错啊
11楼|smthhz|2025-02-20 23:43:39|展开
ds联网能用了？不联网我是没发现比4o好用

【在 updatedq (updatedq) 的大作中提到: 】
:  这不很正常吧
:
:  试了很久，发现如果日常使用的话，deepseek更好用，比gpt o3-mini也好用，特别是联网搜索的时候。
:
--
FROM 117.133.82.*
12楼|smthhz|2025-02-20 23:57:53|展开
用thinking答案没问题

【在 Alohaaaa (Alohaaaa) 的大作中提到: 】
:
:  --
:
:  ※ 来源:·水木社区
--
FROM 117.133.82.*
21楼|smthhz|2025-02-21 09:43:04|展开
我发现和语言有很大关系，用英语问gemini和grok都回答正确，不需要思考，ds用藏语问回答就是3.11更大，但是中文就没问题
【在 Alohaaaa (Alohaaaa) 的大作中提到: 】
:  你说的确实有道理
:  deepseek 也考虑到这一层了
:  【在 heideggerr 的大作中提到: 】
:  : 这种大小比较可能是隐含的，当人们问3.11比3.9多了哪些功能的时候，作为LLM就模糊地领会到3.11是一个比3.9大的东西了，或者换句话说，集合论中集合之间的“大”、“小”和数字空间中的数字之间的“大”、“小”在大模型中是同构的、甚至是同一个东西，所以当人们大量地问3.11比3.9多了哪些功能的时候，集合空间中的“大”、“小”关系就会污染了数字空间中的“大”、“小”关系。
--
FROM 117.133.82.*

BYR-Team©2010. KBS Dev-Team©2011 登录完整版