刚才试验了一下 grok3

水木社区手机版

主题:刚才试验了一下 grok3
楼主|chunhui|2025-02-18 18:11:11|只看此ID
一个编程相关的问题。grok3 claude 回答得很贴切。通义千问也对。 deepseek网页
上深度思考，它自己琢磨了很长一段文字，最后说无法回答。没用深度思考。他也回答
对了，但答案给的是完整的代码文件。其他几个回答只给出的是我要的那两个函数。
--
FROM 111.196.128.*
1楼|EnzoFerraris|2025-02-19 14:01:38|只看此ID
怎么用3，我现在的app上只能选择2？
--
FROM 61.237.229.*
2楼|chunhui|2025-02-19 14:28:01|只看此ID
我在lmarena点ai 用的

【在 EnzoFerraris 的大作中提到: 】
: 怎么用3，我现在的app上只能选择2？
--
FROM 103.90.179.*
3楼|PaoloMaldini|2025-02-19 14:51:19|只看此ID
试试claude

【在 chunhui 的大作中提到: 】
: 一个编程相关的问题。grok3 claude 回答得很贴切。通义千问也对。 deepseek网页
: 上深度思考，它自己琢磨了很长一段文字，最后说无法回答。没用深度思考。他也回答
: 对了，但答案给的是完整的代码文件。其他几个回答只给出的是我要的那两个函数。
: ...................
--
FROM 120.244.15.69
4楼|chunhui|2025-02-19 14:59:44|只看此ID
我不是说了么

【在 PaoloMaldini 的大作中提到: 】
: 试试claude
--
FROM 103.90.179.*
5楼|huaxinjuedui|2025-02-20 10:06:40|只看此ID
说明只要联网搜索能搞定的，就尽量不要用深度思考？

其实有实验数据证明，R1出现幻觉的概率，远大于V3（15%与5%）

【在 chunhui 的大作中提到: 】
: 一个编程相关的问题。grok3 claude 回答得很贴切。通义千问也对。 deepseek网页
: 上深度思考，它自己琢磨了很长一段文字，最后说无法回答。没用深度思考。他也回答
: 对了，但答案给的是完整的代码文件。其他几个回答只给出的是我要的那两个函数。
: ...................
--
FROM 113.206.75.*
6楼|chunhui|2025-02-20 10:31:24|只看此ID
应该也不是联网搜索决定的。只是深度思考有无的区别。

【在 huaxinjuedui 的大作中提到: 】
: 说明只要联网搜索能搞定的，就尽量不要用深度思考？
: 其实有实验数据证明，R1出现幻觉的概率，远大于V3（15%与5%）
--
FROM 117.133.52.*
7楼|exo|2025-02-23 08:30:10|只看此ID
grok3还没用，代码用过的claude效果最好，gpt4和deepseek都一般

【在 chunhui 的大作中提到: 】
: 一个编程相关的问题。grok3 claude 回答得很贴切。通义千问也对。 deepseek网页
: 上深度思考，它自己琢磨了很长一段文字，最后说无法回答。没用深度思考。他也回答
: 对了，但答案给的是完整的代码文件。其他几个回答只给出的是我要的那两个函数。
: ...................
--
FROM 123.114.102.*
8楼|chunhui|2025-02-23 11:01:57|只看此ID
grok3我也只是用了几次试试。大张旗鼓发布也没什么波澜，就可以知道它水平很一般。
【在 exo 的大作中提到: 】
: grok3还没用，代码用过的claude效果最好，gpt4和deepseek都一般
--
FROM 114.241.2.*
9楼|tsa300|2025-02-23 17:32:07|只看此ID
网页上就是3 ，现在都是3 beta ，3正式版还在训练中

【在 EnzoFerraris 的大作中提到: 】
: 怎么用3，我现在的app上只能选择2？
--
FROM 123.120.1.*