- 主题:为什么deepseek没有发生在大厂或者高校的杰青大组里?
有障碍,高校想用免费的学生去做,公司是百万年薪的几十人全职团队去做。
【 在 pkupctner 的大作中提到: 】
: 但这并不是幻方的核心优势,幻方用算法和各种优化把算力需求大幅降下来才是,这些工作在高校做并没有障碍
:
: #发自zSMTH@RMX3366
--
FROM 49.85.194.*
搞一个原型跑通没障碍,原型scale up由商业力量推动
【 在 angusta @ [QingJiao] 的大作中提到: 】
:
: 有障碍,高校想用免费的学生去做,公司是百万年薪的几十人全职团队去做。
:
: 【 在 pkupctner 的大作中提到: 】
: : 但这并不是幻方的核心优势,幻方用算法和各种优化把算力需求大幅降下来才是,这些工作在高校做并没有障碍
#发自zSMTH@RMX3366
--
FROM 39.148.108.*
按说姐青大组没算力,更有动力死磕算法的
- 来自 水木社区APP v3.5.7
【 在 zfbdcyj 的大作中提到: 】
: 杰青大组更僵化。
--
FROM 219.237.176.*
你看这个创始人,就不走寻常路。和什么资源有个毛关系。
【 在 pkupctner 的大作中提到: 】
: 大厂可能是僵化,高校的杰青大组是不是算力资源不够?
: #发自zSMTH@RMX3366
--
FROM 114.218.136.*
都想免费白piao学生,人家企业都是给百万年薪。
技术天才又不是傻子,当然不会给你白piao。
【 在 Crusade 的大作中提到: 】
: 按说姐青大组没算力,更有动力死磕算法的
: - 来自 水木社区APP v3.5.7
--
FROM 49.85.194.*
瓶颈就在于 scale up啊。
原型都有,清华,复旦,很早就宣布自己有了。
【 在 pkupctner 的大作中提到: 】
: 搞一个原型跑通没障碍,原型scale up由商业力量推动
:
: #发自zSMTH@RMX3366
--
FROM 49.85.194.*
不是有没有的问题,是能高效scale up并且表现好的原型
【 在 angusta 的大作中提到: 】
:
: 瓶颈就在于 scale up啊。
:
: 原型都有,清华,复旦,很早就宣布自己有了。
:
#发自zSMTH@RMX3366
--
FROM 39.148.108.*
可以研究一下,deepseek是开源的。
估计有 关键少数,偶然做出了关键的改进。
大学实验室没那么多gpu卡,但是
即便算力给够,国内大厂或谷歌,meta,最近也没什么突破?
【 在 gofly 的大作中提到: 】
: 但是这个团队成员基本都是清北大组出来的,感觉已经很高校了
:
--
FROM 124.64.23.*
在区区几张卡的机器上,能发现deepseek的那些改进的方法?
【 在 pkupctner 的大作中提到: 】
: deepseek做的其实很基础,自己创建数据结构,自己发展算法,这些都可以在高校做,最后出一个有竞争力的大模型那一步再引入商业力量。两手一摊我在高校没那么多卡不是体面的反应
:
: #发自zSMTH@RMX3366
--
FROM 124.64.23.*
已经赢了,为何还要拼
--
FROM 112.64.100.*