架构依然在Transformer框架内的改进,还是突破了?
【 在 profounder 的大作中提到: 】
: 标 题: Re: deepseek是“革命性”创新还是“微”创新?
: 发信站: 水木社区 (Sun Jan 26 17:45:08 2025), 站内
:
:
: 整个架构算是革命性的。
:
: 【 在 chndgnx 的大作中提到: 】
: : 是提出了新训练方法,还是专注于模型蒸馏,在让模型可以变得更小方面有重要进展?
:
: --
:
: ※ 来源:·水木社区 mysmth.net·[FROM: 61.150.11.*]
--
FROM 114.247.186.*