问题是为啥你们一直认为非端到端就是穷举呢?
举个普通人能理解的例子,目标赚钱
端到端就是无论过程,就一个目标,reward赚钱最多
传统非端到端会拆分成n个目标,赚钱概率一个目标,被抓紧去的风险一个目标,员工造反的概率一个目标,每个目标一个深度学习模型,最终通过公式也好,强化学习也好进行理解可控的多目标融合
显然,从工程上来说方法一更简洁,但不可控啊,朋友,方法二依然有极强的学习拟合能力,但明显更加可控,所有兜底都能及其方便的加进去
【 在 afailor 的大作中提到: 】
:穷举理论上是无法实现自动驾驶的。
- 来自 水木社区APP v3.5.7
--
FROM 223.104.40.*