Re: 刚才试验了一下 grok3

水木社区手机版

展开|楼主|同主题展开|溯源|返回

上一篇|下一篇|同主题上篇|同主题下篇

主题:Re: 刚才试验了一下 grok3
personality|2025-02-26 15:43:14|
请问在cursor里用了Claude-3.7-sonnet-thinking了吗？感觉如何

我用了cursor中的thinking，感觉reasoning不弱于deepseek，代码的能力也保持了3.5。在某评测下，3.7 thinking 和 deepseek + claude 3.5 能力差不多。
【在 lvsoft 的大作中提到: 】
: 把deepseek r1的思维过程复制粘贴给chaude，一个简单的deep+claude就能得到现在超过所有大模型的结果。
: 关键是后面这个必须是claude，你用别的大模型来接都没用。说明claude的强是真正的强，并不是刷题的强（不如说它刷题一点也不强），专业一点的说法这叫泛化能力强。
: 我对bench一直是很有意见的，ai届一天其他行业一年，对一个如此光速发展的行业，用的居然还是好几年前的benchmark，简直就是搞笑。目标决定方向，bench就是树立目标的作用，是很重要的。
: ...................
--
修改:personality FROM 59.82.59.*
FROM 59.82.59.*

上一篇|下一篇|同主题上篇|同主题下篇

BYR-Team©2010. KBS Dev-Team©2011 登录完整版