- 主题:deepseek原来是蒸馏的啊,怪不得训练成本低
白高兴一场
--
FROM 39.144.154.*
污蔑啥啊,deepseek论文就说训练第一步是蒸馏
数据只有输出就不能蒸馏了?你不是做技术的料
【 在 dqxl 的大作中提到: 】
: openai不开源,数据只有输出,实际上常规蒸馏根本就不可能,别在污蔑了好吗?
--
FROM 39.144.155.*
不管是蒸馏啥,都是蒸馏。我说蒸馏openai了吗?
【 在 dqxl 的大作中提到: 】
: 它说是蒸馏的openai吗?蒸馏别的开源的,本来就可以。
--
FROM 39.144.155.*
我当然不行,deepseek有多少人我才几个?
【 在 dqxl 的大作中提到: 】
: 你提个方案,蒸馏下开源的,能达到deepseek的水平吗?
--
FROM 39.144.155.*
你没看论文
【 在 sthgot2give 的大作中提到: 】
: 这里完全不看DeepSeek的网站吗?里面有自研模型也有蒸馏的主流模型。
: 我也不支持炒作,但是不要胡说还不好?
--
FROM 139.226.119.*