水木社区手机版
首页
|版面-人工智能(AI)|
新版wap站已上线
返回
1/1
|
转到
主题:deepseek原来是蒸馏的啊,怪不得训练成本低
1楼
|
Xjt
|
2025-01-30 21:22:52
|
展开
我早说了,关键是他的R1的训练过程,目前看有点东西,可能是真创新。Deepseek V3只能说很一般。
Hugging face已经在企图复原R1的训练过程了
【 在 artech51 的大作中提到: 】
: 白高兴一场
--
FROM 114.102.121.*
1/1
|
转到
选择讨论区
首页
|
分区
|
热推
BYR-Team
©
2010.
KBS Dev-Team
©
2011
登录完整版