- 主题:deepseek这些大模型和TensorFlow、pytorch这些有关系吗 (转载)
知识更新太快,更不上时代
现在大火的这些ai大模型,deepseek,豆包这些
和前几年的TensorFlow、pytorch这些有关系吗
这两个过时了吗,是不是被transformer替代了的意思
--
修改:Fuxing2017 FROM 223.104.3.*
FROM 223.104.40.*
直接投给ds
--
FROM 223.104.40.*
我感觉类似于香蕉、苹果、榴莲的关系。
【 在 Fuxing2017 的大作中提到: 】
: 知识更新太快,更不上时代
: 现在大火的这些ai大模型,deepseek,豆包这些
: 和前几年的TensorFlow、pytorch这些有关系吗
: ...................
--
FROM 183.208.181.*
你看来根本没入门啊,TensorFlow、pytorch是python工具包,deepseek是应用软件
【 在 Fuxing2017 的大作中提到: 】
: 知识更新太快,更不上时代
: 现在大火的这些ai大模型,deepseek,豆包这些
: 和前几年的TensorFlow、pytorch这些有关系吗
: ...................
--
FROM 122.4.77.*
deepseek是一个训练好了的神经元网络参数集合,可以用pytorch之类调用
【 在 valah 的大作中提到: 】
: 你看来根本没入门啊,TensorFlow、pytorch是python工具包,deepseek是应用软件
--
FROM 123.120.9.*
deepseek只是一个神经元网络参数集合吗?端到端神经网络能生成文字,但能做意图理解?行动执行,以及网络搜索吗?恐怕还不能把,那就是一个应用软件,集合了多种功能的模块,神经网络只是其中之一。
【 在 tarry 的大作中提到: 】
: deepseek是一个训练好了的神经元网络参数集合,可以用pytorch之类调用
:
--
FROM 122.4.77.*
是一套多层decoder only的transformer架构的神经网络,以autoregressive方式工作
所以神经网络只是根据已有的文本预测下一个字符
其他的东西都是deepseek的服务,不在神经网络的范畴
需要额外的工作量
【 在 valah 的大作中提到: 】
: deepseek只是一个神经元网络参数集合吗?端到端神经网络能生成文字,但能做意图理解?行动执行,以及网络搜索吗?恐怕还不能把,那就是一个应用软件,集合了多种功能的模块,神经网络只是其中之一。
--
修改:tgfbeta FROM 221.198.65.*
FROM 221.198.65.*