- 主题:标 题: Deepseek创始人是通信硕士,又一次二档选手干翻专家
你干脆说马斯克,雷军好了。
【 在 NewBorn 的大作中提到: 】
: openai的奥特曼也是给人感觉干啥啥成。但chatgpt的主要功劳还是那几位核心的研发人员。
:
--
FROM 39.144.105.*
梁文峰跟奥特曼更像啊,马斯克、雷军毕竟是干实体企业出身的。
【 在 angusta 的大作中提到: 】
: 你干脆说马斯克,雷军好了。
:
:
--
修改:NewBorn FROM 101.5.42.*
FROM 101.5.42.*
吹上天了
【 在 angusta 的大作中提到: 】
发信人: Engelberger (missing), 信区: NewExpress
标 题: Deepseek创始人是通信硕士,又一次二档选手干翻专家
发信站: 水木社区 (Sat Jan 25 14:19:10 2025), 站内
梁文峰1985年出生,
2002年考入浙大电子系,
2010年通信硕士毕业,毕业后到成都旅居2年多,租房看书,上网,泡图书馆,琢磨量化
2013年回到杭州,与同学创办雅克比
2015年在杭州创办幻方
2023年在杭州创办deepseek,
2024年12月,发布deepseek v3,以数量级少于openai及anthropic的算力资源,实现了业界一流的大模型成果,有望终结微软谷歌meta的ai霸权和英伟达,台积电的利润神话,进而削弱美股美元基础,改变世界格局。
Deepseek又是一次宇树的翻版。创始人有技术背景,但在传统科研评价体系中,根本上不了桌。梁文峰的通信硕士背景十几年前投bat简历,都不会认为是正统科班出身,只能拿普通offer,投正儿八经的量化基金,也会认为是二档简历。但他简历断档三年闭门造车,然后又在非科研领域工作了十年,在公认的竞争最激烈的红海,所有的科技巨头砸钱最狠的赛道,居然后来居上了。上次宇树全球领先,还有人说机器狗是工程,不是科研;这回deepseek训练大模型,总算科研了吧?诺奖级成果。2024诺奖都有2个给大模型了。
1.无论是deepseek对bath,还是pdd对阿里京东,还是宇树,说明科技行业市场永远是开放的,红海并不是禁区,没有公司能确保壁垒万世不倒。
2.新质生产力的论文确实要写到祖国大地上。无论是量化还是deepseek,梁文峰一直是应用导向的,主刷论文ai四小龙早就拍在沙滩上了,计算所清华达摩院2012实验室深度学习研究院甚至msra各种豪华阵容居然被小小的百来号人的创业公司超过了。
--
FROM 124.79.181.*
先让deepsek新闻跑一会,如果是真的话。
它的成本只有主流技术路线的二十分之一,不是资源的问题。
这种事应该是高校来做的,但高校做不了,还是得靠业界来做。
就有那意味了,东厂西厂我都要管,
【 在 NewBorn 的大作中提到: 】
: 高校肯定做不了大模型的,既没有算力又没有数据。
: Deepseek若没有作为主力的清北毕业生,肯定成不了。当然没有梁文峰也不会有deepseek。其实deepseek只是国内大模型进步的一个缩影,其他大模型如kimi、豆包现在也是很厉害。
:
--
修改:karaisan FROM 36.28.200.*
FROM 36.28.200.*
网上信息透露Deepseek有5万张H100显卡啊,这都不是一般公司具备的。
还说大模型应该是高校来做的,世界上哪个高校能做?是斯坦福还是MIT?
实际上中国高校做的很好了,培养了这方面众多优秀的毕业生,才成就了Deepseek(其研发主力就是北大、清华的博士毕业生)。
【 在 karaisan 的大作中提到: 】
: 先让deepsek新闻跑一会,如果是真的话。
: 它的成本只有主流技术路线的二十分之一,不是资源的问题。
: 这种事应该是高校来做的,但高校做不了,还是得靠业界来做。
: ...................
--
FROM 114.253.36.*
哦?国内难道不是找不到好工作的去读博?
【 在 angusta 的大作中提到: 】
: 发信人: Engelberger (missing), 信区: NewExpress
: 标 题: Deepseek创始人是通信硕士,又一次二档选手干翻专家
: 发信站: 水木社区 (Sat Jan 25 14:19:10 2025), 站内
:
: 梁文峰1985年出生,
:
: ..................
发自「今日水木 on M2012K11AC」
--
FROM 221.216.116.*
媒体宣传花了不少钱吧
实际用效果一般
和openai,claude差很多
【 在 angusta 的大作中提到: 】
: 梁文峰1985年出生,
: 2002年考入浙大电子系,
: 2010年通信硕士毕业,毕业后到成都旅居2年多,租房看书,上网,泡图书馆,琢磨量化
: 2013年回到杭州,与同学创办雅克比
: 2015年在杭州创办幻方
: ...
- 来自 水木说
--
FROM 42.84.232.*
真正宣传它的根本就不是媒体,媒体哪有那个水平去比较llm的高下
【 在 hbo 的大作中提到: 】
: 媒体宣传花了不少钱吧
: 实际用效果一般
: 和openai,claude差很多
: ...................
--
FROM 111.197.238.*
北京不是有个智源研究院嘛,专搞大模型的,一堆响当当的专家。
【 在 karaisan 的大作中提到: 】
: 先让deepsek新闻跑一会,如果是真的话。
: 它的成本只有主流技术路线的二十分之一,不是资源的问题。
: 这种事应该是高校来做的,但高校做不了,还是得靠业界来做。
: ...................
--
FROM 49.85.194.*
北京不是有个智源研究院嘛,专搞大模型的,一堆响当当的专家。
【 在 NewBorn 的大作中提到: 】
: 网上信息透露Deepseek有5万张H100显卡啊,这都不是一般公司具备的。
: 还说大模型应该是高校来做的,世界上哪个高校能做?是斯坦福还是MIT?
: 实际上中国高校做的很好了,培养了这方面众多优秀的毕业生,才成就了Deepseek(其研发主力就是北大、清华的博士毕业生)。
: ...................
--
FROM 49.85.194.*