水木社区手机版
首页
|版面-人工智能(AI)|
新版wap站已上线
展开
|
楼主
|
同主题展开
|
溯源
|
返回
上一篇
|
下一篇
|
同主题上篇
|
同主题下篇
主题:Re: deepseek原来是蒸馏的啊,怪不得训练成本低
District9
|
2025-02-03 18:00:57
|
R1前面还有个R1 zero,那个才是关键
R1是R1 zero的人工调校版
【 在 Xjt 的大作中提到: 】
:我早说了,关键是他的R1的训练过程,目前看有点东西,可能是真创新。Deepseek V3只能说很一般。:Hugging
--
FROM 174.203.6.*
上一篇
|
下一篇
|
同主题上篇
|
同主题下篇
选择讨论区
首页
|
分区
|
热推
BYR-Team
©
2010.
KBS Dev-Team
©
2011
登录完整版