- 主题:Re: DeepSeek开源权重不开源模型对“商用”没啥意义
举个你说的“开源模型”的LLM的例子?
【 在 Ezer 的大作中提到: 】
: 不开源模型,就无法自己更新迭代,用得越多套得越牢
: 发自「今日水木 on M2012K11AC」
--
FROM 61.51.91.*
从开源软件角度,deepseek算是free software,不算是open source
--
FROM 183.195.9.*
一行automodel就导入模型了,你说怎样才算开源模型。
--
FROM 125.69.13.*
权重也开源的,本地部署的时候权重文件就保存在本地,你有完全访问权限
【 在 netvideo 的大作中提到: 】
: 一行automodel就导入模型了,你说怎样才算开源模型。
--
FROM 183.195.37.*
人家还是MIT开源,你是可修改后商用的,也允许蒸馏,这在开源里也算是很宽松了。
--
FROM 125.69.13.*
LZ的意思应该是把模型训练过程也开源,包括模型训练算法、语料,甚至训练设备也应该放到云端,让大家免费使用!
【 在 netvideo 的大作中提到: 】
: 一行automodel就导入模型了,你说怎样才算开源模型。
--
FROM 113.233.213.*
楼主不过是鸡蛋里面挑骨头,为了喷和打击中国AI罢了。
【 在 heideggerr 的大作中提到: 】
: LZ的意思应该是把模型训练过程也开源,包括模型训练算法、语料,甚至训练设备也应该放到云端,让大家免费使用!
:
--
FROM 183.194.169.*
deepseek 论文已经公开了许多详细的技术细节
--
FROM 222.129.1.*
没有源代码,很难复现包括encoder的完整模型
【 在 dreamr 的大作中提到: 】
:
: deepseek 论文已经公开了许多详细的技术细节
: --
: 如果开始回忆过去,说明你正在变老
:
发自「今日水木 on M2012K11AC」
--
FROM 117.59.173.*
你懂个屁
【 在 Ezer (Ezer) 的大作中提到: 】
: 不开源模型,就无法自己更新迭代,用得越多套得越牢
:
: 发自「今日水木 on M2012K11AC」
: --
--
FROM 114.249.224.*