是一套多层decoder only的transformer架构的神经网络,以autoregressive方式工作
所以神经网络只是根据已有的文本预测下一个字符
其他的东西都是deepseek的服务,不在神经网络的范畴
需要额外的工作量
【 在 valah 的大作中提到: 】
: deepseek只是一个神经元网络参数集合吗?端到端神经网络能生成文字,但能做意图理解?行动执行,以及网络搜索吗?恐怕还不能把,那就是一个应用软件,集合了多种功能的模块,神经网络只是其中之一。
--
修改:tgfbeta FROM 221.198.65.*
FROM 221.198.65.*