1)老美那边也有声音,说蒸馏是大模型领域通行做法,不是deepseek一家在用,openai也蒸馏别家的数据,特别是汉语的,最近o3 mini和其他版本都能问出问题,前面有人贴了
2)蒸馏不是什么特别的技术,不只有deepseek一家会,大家都会,也都用
3)蒸馏不是deepseek能取得突破的原因,看1)和2),如果蒸馏是原因,大家早就是一个水平了
4)用蒸馏来混淆视听的,不是蠢就是坏,openai的人和白宫的是坏,你可能是蠢、或者蠢加坏
【 在 artech51 的大作中提到: 】
: 白高兴一场
--
FROM 58.247.119.*