为什么deepseek没有发生在大厂或者高校的杰青大组里？

水木社区手机版

主题:为什么deepseek没有发生在大厂或者高校的杰青大组里？
40楼|angusta|2025-01-26 14:48:18|只看此ID
有障碍，高校想用免费的学生去做，公司是百万年薪的几十人全职团队去做。

【在 pkupctner 的大作中提到: 】
: 但这并不是幻方的核心优势，幻方用算法和各种优化把算力需求大幅降下来才是，这些工作在高校做并没有障碍
:
: #发自zSMTH@RMX3366
--
FROM 49.85.194.*
41楼|pkupctner|2025-01-26 14:52:19|只看此ID
搞一个原型跑通没障碍，原型scale up由商业力量推动

【在 angusta @ [QingJiao] 的大作中提到: 】
:
: 有障碍，高校想用免费的学生去做，公司是百万年薪的几十人全职团队去做。
:
: 【在 pkupctner 的大作中提到: 】
: : 但这并不是幻方的核心优势，幻方用算法和各种优化把算力需求大幅降下来才是，这些工作在高校做并没有障碍

#发自zSMTH@RMX3366
--
FROM 39.148.108.*
42楼|Crusade|2025-01-26 14:55:41|只看此ID
按说姐青大组没算力，更有动力死磕算法的
- 来自水木社区APP v3.5.7
【在 zfbdcyj 的大作中提到: 】
: 杰青大组更僵化。
--
FROM 219.237.176.*
43楼|yymtnt|2025-01-26 14:56:20|只看此ID
你看这个创始人，就不走寻常路。和什么资源有个毛关系。

【在 pkupctner 的大作中提到: 】
: 大厂可能是僵化，高校的杰青大组是不是算力资源不够？
: #发自zSMTH@RMX3366
--
FROM 114.218.136.*
44楼|angusta|2025-01-26 14:57:15|只看此ID
都想免费白piao学生，人家企业都是给百万年薪。

技术天才又不是傻子，当然不会给你白piao。

【在 Crusade 的大作中提到: 】
: 按说姐青大组没算力，更有动力死磕算法的
: - 来自水木社区APP v3.5.7
--
FROM 49.85.194.*
45楼|angusta|2025-01-26 15:00:53|只看此ID
瓶颈就在于 scale up啊。

原型都有，清华，复旦，很早就宣布自己有了。

【在 pkupctner 的大作中提到: 】
: 搞一个原型跑通没障碍，原型scale up由商业力量推动
:
: #发自zSMTH@RMX3366
--
FROM 49.85.194.*
46楼|pkupctner|2025-01-26 15:05:03|只看此ID
不是有没有的问题，是能高效scale up并且表现好的原型

【在 angusta 的大作中提到: 】
:
: 瓶颈就在于 scale up啊。
:
: 原型都有，清华，复旦，很早就宣布自己有了。
:

#发自zSMTH@RMX3366
--
FROM 39.148.108.*
47楼|kod2009|2025-01-26 15:08:12|只看此ID
可以研究一下，deepseek是开源的。
估计有关键少数，偶然做出了关键的改进。
大学实验室没那么多gpu卡，但是
即便算力给够，国内大厂或谷歌，meta，最近也没什么突破？
【在 gofly 的大作中提到: 】
: 但是这个团队成员基本都是清北大组出来的，感觉已经很高校了
:
--
FROM 124.64.23.*
48楼|kod2009|2025-01-26 15:11:24|只看此ID
在区区几张卡的机器上，能发现deepseek的那些改进的方法？
【在 pkupctner 的大作中提到: 】
: deepseek做的其实很基础，自己创建数据结构，自己发展算法，这些都可以在高校做，最后出一个有竞争力的大模型那一步再引入商业力量。两手一摊我在高校没那么多卡不是体面的反应
:
: #发自zSMTH@RMX3366
--
FROM 124.64.23.*
49楼|lengdong|2025-01-26 15:11:41|只看此ID
已经赢了，为何还要拼
--
FROM 112.64.100.*