Re: DeepSeek开源权重不开源模型对“商用”没啥意义

水木社区手机版

主题:Re: DeepSeek开源权重不开源模型对“商用”没啥意义
楼主|qgg|2025-02-16 01:23:21|只看此ID
举个你说的“开源模型”的LLM的例子？
【在 Ezer 的大作中提到: 】
: 不开源模型，就无法自己更新迭代，用得越多套得越牢
: 发自「今日水木 on M2012K11AC」
--
FROM 61.51.91.*
1楼|CongHL|2025-02-16 08:33:40|只看此ID
从开源软件角度，deepseek算是free software，不算是open source
--
FROM 183.195.9.*
2楼|netvideo|2025-02-16 10:51:32|只看此ID
一行automodel就导入模型了，你说怎样才算开源模型。
--
FROM 125.69.13.*
3楼|johnbird|2025-02-16 10:52:42|只看此ID
权重也开源的，本地部署的时候权重文件就保存在本地，你有完全访问权限
【在 netvideo 的大作中提到: 】
: 一行automodel就导入模型了，你说怎样才算开源模型。
--
FROM 183.195.37.*
4楼|netvideo|2025-02-16 11:02:17|只看此ID
人家还是MIT开源，你是可修改后商用的，也允许蒸馏，这在开源里也算是很宽松了。
--
FROM 125.69.13.*
5楼|heideggerr|2025-02-16 12:40:11|只看此ID
LZ的意思应该是把模型训练过程也开源，包括模型训练算法、语料，甚至训练设备也应该放到云端，让大家免费使用！

【在 netvideo 的大作中提到: 】
: 一行automodel就导入模型了，你说怎样才算开源模型。
--
FROM 113.233.213.*
6楼|usami|2025-02-16 14:48:44|只看此ID
楼主不过是鸡蛋里面挑骨头，为了喷和打击中国AI罢了。
【在 heideggerr 的大作中提到: 】
: LZ的意思应该是把模型训练过程也开源，包括模型训练算法、语料，甚至训练设备也应该放到云端，让大家免费使用！
:
--
FROM 183.194.169.*
7楼|dreamr|2025-02-16 22:30:32|只看此ID
deepseek 论文已经公开了许多详细的技术细节
--
FROM 222.129.1.*
8楼|Ezer|2025-02-16 22:43:36|只看此ID
没有源代码，很难复现包括encoder的完整模型
【在 dreamr 的大作中提到: 】
:
: deepseek 论文已经公开了许多详细的技术细节
: --
: 如果开始回忆过去，说明你正在变老
:

发自「今日水木 on M2012K11AC」
--
FROM 117.59.173.*
9楼|db1|2025-02-17 00:12:04|只看此ID
你懂个屁

【在 Ezer (Ezer) 的大作中提到: 】
:  不开源模型，就无法自己更新迭代，用得越多套得越牢
:
:  发自「今日水木 on M2012K11AC」
:  --
--
FROM 114.249.224.*