- 主题:看了deepseek团队介绍,感觉潜力很大
论证一大堆扯,就看投入产出比,你说小模型是捷径,又没人拦着不让其他家走,也作出结果来嘛
【 在 lvsoft (Lv(The Last Guardian)) 的大作中提到: 】
: 这次训练只用了2000张卡。
: 另外坦白地说我一点也不觉得这个成果算多好,放一年前可以这么说,放现在只能是平均水准。
: v3是moe模型,有256个37b小模型组成。简单的说就是你每次问题都会路由到某一个最适合解决这个问题的37b小模型处理。
:
--
FROM 114.249.224.*
幻方那一万张A100一开始不是用来做这个的。算是无心插柳吧。
【 在 lvsoft 的大作中提到: 】
: 幻方量化下面的深度求索团队。
: 做量化私募对冲基金的。
: 其实deepseek还是蛮低调的,早在百度等互联网巨头屯卡之前早早就屯好了上万张卡。
: ...................
--
FROM 106.39.107.*
毛病吧?我前面列的3个模型不是结果?
这种超过所有开源模型的结果每2-3个月就会爆出一个,也就是你们这帮外行会当个事。
比如一年前的mistral 8x7b,这个就是8个7b模型,在当时就做到了开源大模型第一呀,你真以为deepseek这种事是第一次么?
顺便你以为就你知道moe好别人都是蠢货嘛?你知道moe的问题吗?你知道gpt4就是moe模型,要追根溯源的话一切都源自gpt4么?
【 在 db1 的大作中提到: 】
: 论证一大堆扯,就看投入产出比,你说小模型是捷径,又没人拦着不让其他家走,也作出结果来嘛
--
修改:lvsoft FROM 39.144.40.*
FROM 222.68.48.*
哈哈哈,我外行?说说你有多内行?哗众取宠的言论你倒是挺在行
【 在 lvsoft (Lv(The Last Guardian)) 的大作中提到: 】
: 毛病吧?我前面列的3个模型不是结果?
: 这种超过所有开源模型的结果每2-3个月就会爆出一个,也就是你们这帮外行会当个事。
: 比如一年前的mistral 8x7b,这个就是8个7b模型,在当时就做到了开源大模型第一呀,你真以为deepseek这种事是第一次么?
:
--
FROM 114.249.224.*
你觉得我说的都是哗众取宠,那你这不妥妥的外行嘛?
来吧,你就说我哪里说的有问题呗
【 在 db1 的大作中提到: 】
: 哈哈哈,我外行?说说你有多内行?哗众取宠的言论你倒是挺在行
--
修改:lvsoft FROM 117.135.82.*
FROM 117.135.82.*
后续怎么操作?
【 在 SlO 的大作中提到: 】
: 花钱找人发点小作文,吹一下团队。这是融资的基本操作。
--
FROM 223.246.90.*
lv总您最近活都给ai干了,闲得很呐?
【 在 lvsoft 的大作中提到: 】
: 你觉得我说的都是哗众取宠,那你这不妥妥的外行嘛?
: 来吧,你就说我哪里说的有问题呗
--
FROM 116.232.18.*
看了这个团队介绍。对普通人来说,肯定是很厉害的。
但是放到AI大模型团队了,也是很普通的,也就中等偏上。
【 在 jansea 的大作中提到: 】
: 今天虎嗅有篇文章介绍里边的团队成员,都挺厉害的哈
: 不知道资方是啥背景
--
FROM 120.244.84.*
没错哈,团队又年轻,又有能力,所以说潜力不错
不看上面各位大佬打嘴仗了,我就先用起来再说了,国内的也就这个和豆包看着不错
【 在 iceroom 的大作中提到: 】
: 看了这个团队介绍。对普通人来说,肯定是很厉害的。
: 但是放到AI大模型团队了,也是很普通的,也就中等偏上。
:
--
FROM 120.244.23.*
deepseek他自己就是资方, 国内量化巨头,北九坤,南幻方
【 在 jansea 的大作中提到: 】
: 今天虎嗅有篇文章介绍里边的团队成员,都挺厉害的哈
: 不知道资方是啥背景
--
FROM 111.203.85.*