- 主题:deepseek是“革命性”创新还是“微”创新?
整个架构算是革命性的。
【 在 chndgnx 的大作中提到: 】
: 是提出了新训练方法,还是专注于模型蒸馏,在让模型可以变得更小方面有重要进展?
--
FROM 61.150.11.*
总体结构是创新的。
【 在 chndgnx 的大作中提到: 】
: 架构依然在Transformer框架内的改进,还是突破了?
--
FROM 61.150.11.*
这个不是根本原因。
【 在 mindcontrol 的大作中提到: 】
: 训练成本降低是因为它可以利用现有语言模型来进行训练
: 有人在刚发布时用英文提问它的model
: 回答是chatgpt
: ...................
--
FROM 61.150.11.*