求教一个问题哈
“基本思路就是mcts做策略搜索,ai去学会mcts的结果,并成为mcts的评价函数反过来提升mcts的效果。”
具体到楼主视频里的场景,好奇ai+mcts是怎么work的,假设给足够的时间、遇见足够的cornercase,但如果有新的cornercase 这套方法能从本质上解决这个问题吗?
【 在 lvsoft 的大作中提到: 】
: 不是,tesla并不靠设置规则去完善驾驶策略。
:
: tesla的自动驾驶说穿了就分这几块。一块是hydranet(老马表示会改名,这个名字是一个sex toy...),这块负责视觉,识别道路上标志,路道,车辆,行人,速度等等任务。最近在这个.69版本增加了occupynet,用来形成障碍物禁区,达到激光雷达类似的效果确保不会进入禁区。
:
: 然后才是寻路算法,这块才体现驾驶策略。这块的实现方法是mcts+ai,跟alphago有点类似。可以在足够多的案例中自己进化出最合适的驾驶策略。评价维度包括通行效率,安全性和舒适性。基本思路就是mcts做策略搜索,ai去学会mcts的结果,并成为mcts的评价函数反过来提升mcts的效果。这块才是体现fsd老司机的一面,面对千变万化的道路情况有很多博弈和合作的问题需要解决,这块fsd目前我认为还没做到足够好,但也只是一个给足够时间和样本就能进化的过程。
:
: 当然外围系统还有一堆,包括数据样本的增扩,仿真环境,自动标注等等。人为设置的部分,主要体现在仿真环境。会有人去建造一条虚拟的公路,在里面去引入各种corner case,或者增加现实中遇到的corner case的样本数量,然后喂给AI去学习。
:
: 基本上,AI时代,如果你想认真做事,就不太可能用人为设置规则的方法做事了,只可能有人为设置样本和目标,让ai自己去逼近。反倒是想快速出demo可以用人为设置规则的方式快速作秀。这也是为啥tesla从一开始公测就不吝啬于暴露fsd的缺陷,而众多友商到现在都不敢给用户大规模推送在demo中各种“吊打”fsd的版本。
:
: 说难听点,各友商“吊打fsd”的demo是不是真实的我都要打个问号。ai背后是个真人这种事情又不稀奇的咯,发生过太多次了。
:
: --
--
修改:zhuxiaozhu FROM 115.227.100.*
FROM 115.227.100.*