【 在 lvsoft 的大作中提到: 】
: 把deepseek r1的思维过程复制粘贴给chaude,一个简单的deep+claude就能得到现在超过所有大模型的结果。
: 关键是后面这个必须是claude,你用别的大模型来接都没用。说明claude的强是真正的强,并不是刷题的强(不如说它刷题一点也不强),专业一点的说法这叫泛化能力强。
: 我对bench一直是很有意见的,ai届一天其他行业一年,对一个如此光速发展的行业,用的居然还是好几年前的benchmark,简直就是搞笑。目标决定方向,bench就是树立目标的作用,是很重要的。
: ...................
关于第一句话请教一下吕博。"把deepseek r1的思维过程复制粘贴给claude,一个简单的deep+claude就能得到现在超过所有大模型的结果。"
是说把 deepseek r1 产生的思考 COT 复制给 claude吗?不是复制思考后的正式回答?
--
修改:coldmoon FROM 111.193.88.*
FROM 111.193.88.*