年初大火的大模型,各种ChatGPT,核心就是transformer,证明了大力出奇迹。
智能驾驶的网络其实就是各种transformer模块组合,初期bev是靠各种糅合,21年用transformer一统江湖。今年9月FSD v12所说的端到端,老马很隐晦的说“方法就摆在眼前,只不过没想到而已”,业内猜测就是transform把最后的轨迹预测部分取代了(之前用的是穿透的是蒙特卡洛、各种搜索算法,纯trick),这块完成以后,后面就是大力出奇迹的时刻了。
视觉识别模型目前还没到GPT那个阶段,主要是训练所需的算力需求太恐怖了,OpenAI要搞1000万块GPU来训练世界模型,是GPT4所需GPU的400倍。。。
国内商汤等已经在这块完成了实验,上车也是时间问题,所以说技术差异其实没那么大,主要还是在算力上。。。
【 在 Muscle2021 的大作中提到: 】
: 涨知识了
--
FROM 114.246.98.*