- 主题:刚才试验了一下 grok3
一个编程相关的问题。grok3 claude 回答得很贴切。 通义千问也对。 deepseek网页
上深度思考,它自己琢磨了很长一段文字,最后说无法回答。没用深度思考。他也回答
对了,但答案给的是完整的代码文件。其他几个回答只给出的是我要的那两个函数。
--
FROM 111.196.128.*
怎么用3,我现在的app上只能选择2?
--
FROM 61.237.229.*
我在lmarena点ai 用的
【 在 EnzoFerraris 的大作中提到: 】
: 怎么用3,我现在的app上只能选择2?
--
FROM 103.90.179.*
试试claude
【 在 chunhui 的大作中提到: 】
: 一个编程相关的问题。grok3 claude 回答得很贴切。 通义千问也对。 deepseek网页
: 上深度思考,它自己琢磨了很长一段文字,最后说无法回答。没用深度思考。他也回答
: 对了,但答案给的是完整的代码文件。其他几个回答只给出的是我要的那两个函数。
: ...................
--
FROM 120.244.15.69
我不是说了么
【 在 PaoloMaldini 的大作中提到: 】
: 试试claude
--
FROM 103.90.179.*
说明只要联网搜索能搞定的,就尽量不要用深度思考?
其实有实验数据证明,R1出现幻觉的概率,远大于V3(15%与5%)
【 在 chunhui 的大作中提到: 】
: 一个编程相关的问题。grok3 claude 回答得很贴切。 通义千问也对。 deepseek网页
: 上深度思考,它自己琢磨了很长一段文字,最后说无法回答。没用深度思考。他也回答
: 对了,但答案给的是完整的代码文件。其他几个回答只给出的是我要的那两个函数。
: ...................
--
FROM 113.206.75.*
应该也不是联网搜索决定的。只是深度思考有无的区别。
【 在 huaxinjuedui 的大作中提到: 】
: 说明只要联网搜索能搞定的,就尽量不要用深度思考?
: 其实有实验数据证明,R1出现幻觉的概率,远大于V3(15%与5%)
--
FROM 117.133.52.*
grok3还没用,代码用过的claude效果最好,gpt4和deepseek都一般
【 在 chunhui 的大作中提到: 】
: 一个编程相关的问题。grok3 claude 回答得很贴切。 通义千问也对。 deepseek网页
: 上深度思考,它自己琢磨了很长一段文字,最后说无法回答。没用深度思考。他也回答
: 对了,但答案给的是完整的代码文件。其他几个回答只给出的是我要的那两个函数。
: ...................
--
FROM 123.114.102.*
grok3我也只是用了几次试试。大张旗鼓发布也没什么波澜,就可以知道它水平很一般。
【 在 exo 的大作中提到: 】
: grok3还没用,代码用过的claude效果最好,gpt4和deepseek都一般
--
FROM 114.241.2.*
网页上就是3 ,现在都是3 beta ,3正式版还在训练中
【 在 EnzoFerraris 的大作中提到: 】
: 怎么用3,我现在的app上只能选择2?
--
FROM 123.120.1.*