上海那,光商汤一个楼的算力就3E了。Dojo基本算是失败的产品了,成本是H100的几倍
,可能建了几个E,主要还是H100也说不定,100E可能性有,不大;现在老马只是说算力
不再是约束问题,以及每几个月算力翻倍,每年x10这类的话,已经淡化dojo了。
H100这种,最低都是按周来计费的,v12这种端到端,训练模型其实不难,算力也可以裁
剪的,比如不训练不活跃梯度(这也是国内大模型finetune的主要思路)。最难的还是数
据集,这些都是要更大更好的模型来筛数据的,早在v10阶段,tsl的标注算力就有
500-600P的算力了,仅次于小鹏的训练用算力。v12这种估计会更加消耗算力,2022年tsl
开始搞端到端,计算资源很缺,大概用了8个月老马才直播,不知道demo阶段模型迭代了
几轮。
已经给德国官员demo了,感觉v12还行,国内有可能finetune几次就可以用了,但效果只
能说达到美国的百分之多少,等国内E2E跟上,继续被吊打也是有可能的。毕竟东数西算
,几年内会发生很多事情,国内算力互相很难拉开差距,迭代速度没差异,很难说互相能
差多少。
【 在 wsnsw 的大作中提到: 】
: Dojo今年10月份说算力要达到100E,
: 3月份的一个报道,临港可调度的算力规模是3E,
: 不清楚它的端到端需要多少算力,是连续使用,还是隔几天跑一遍用几个小时。
: ...................
--
FROM 114.246.99.*