诶?你为啥觉得做个普通司机是个很简单的事情啊?
你能说出这种话说明你对ai的理解就是个纯外行。
自动驾驶首先,它就是个AGI场景。开车并不是按规矩开车就行,你需要读出周围的环境,判断周围车辆行为的意图,并在很多场合都需要和别人博弈和合作,并且方式方法内容上还存在无穷多的可能性。这些都只有agi才能做到100%,或者在99.9%后面怼出足够多的9。
其次,从ai处理的问题复杂度来说,语言是一维的,图像是二维的,视频是三维的,难度逐项提升。就好比现在热门的文生图为例,你看一旦尝试用它来生成视频,前后两帧间的抖动问题就解决不了,因为它根本就没有前后帧上下文的概念。现在大厂的文生视频确实具备这个能力,但也还只能生成低分辨率低质量的视频流,相当于只处在文生图早期阶段。
同时,自动驾驶不仅仅是多路视频的问题,它还涉及对3d空间的理解,而现在具备在ai层面直接理解3d空间的ai也屈指可数(别跟我拿那些通过投影变换整出来的3d说事,诸如各种slam技术,这种都是ai嫁接传统算法)。也就是近两年tesla整出的vector space算是首次在3d空间直接进行识别的大规模工业化尝试。
最后,自动驾驶这个场景还要做到100毫秒内的响应延迟。你知道这意味着啥嘛?一张3090跑区区6B的LLaMa需要4秒才能产生一个token,而一段对话有上千个token。chatgpt推测有175B的规模。能力直逼agi同时还要做到100毫秒响应,这背后需要的算力往少算也是100万张a100的级别
以上几点,任意一点单独拿出来都是很大的难题,想要同时满足更是难上加难。而你居然认为自动驾驶是可以随便搞搞就能打脸的东西?
任何事情随便搞搞做到80%都容易得很,这也是为啥阿猫阿狗都在搞无人驾驶,也包括为啥阿猫阿狗都在忙着发布chatgpt平替。但我只能说,如果认知只到这个层次,大概也就是被pdd的营销套路pua的级别吧。
最后说说自动驾驶的现状。现在的自动驾驶,距离普通人可以说很远又不远。所谓不远是现在的自动驾驶大概能做到99.99%,距离100%确实不远,但所谓的很远是指往后面继续增加的每个9,都难如登天。自动驾驶可能要到99.999999999%才会逐步有商业保险入局来承担风险责任。即使gpt5发布,agi降临,那也依然只解决了我前面说的第一个问题罢了,依然算不上能解决。
所以现在的自动驾驶路线,都是弱人工智能,都是某种程度的近似,或者嫁接传统算法来放大。本质上都是在做各种workaround。但另一方面来说,以美国为例,全年交通事故死亡人数是5w量级,相当于每天都要摔一家737。从这个角度来说人开车的安全性本来就不高,自动驾驶也没必要做到agi,只要综合的安全性超过人几倍就行。毕竟人的智力目前虽然还是天花板,但其他方面的缺陷也多的是。而这一点其实tesla距离成功已经很接近了。所以我也不知道你这个所谓的打脸是什么意思。看看这表现,你真的认为自动驾驶还很远,还只能被各种打脸么?
http://b23.tv/yaeC9F8
【 在 hartcomm 的大作中提到: 】
: AI做个普通司机都做不了 还能做什么? 无人驾驶真是啪啪打AI的脸啊
--
FROM 180.158.59.*