所以你不懂啥叫策略网络?确实有代码,但是它的深度和广度已经不是由A场景触发B行为了,而是由A触发1000项分支行为。由于世界上不可能存在完全相同的场景,尤其是在实际公开道路,即使是封闭环境,比如由于光线,当前车速,周围环境障碍物的不同,汽车的行驶方式都会有不同的变化。
【 在 qtpr @ [GreenAuto] 的大作中提到: 】
:
: 别扯淡了,只要你定义所谓的最优策略,就是由算法代码决定的。由算法代码决定的东西,在相同的条件下就会总是被触发。
:
: 【 在 rasper 的大作中提到: 】
: : 那你就错了,现在智驾已经有浓厚的AI意味,博弈的成分和实时调整的成分越来越多,也就是一个条件会触发几万种策略,它再选择其中最优的那一个。这意味着你重复某一个相同场景,智驾的表现都是不同的。
#发自zSMTH@SM-S9280
--
FROM 223.104.40.*