【 在 Haimdinger 的大作中提到: 】
: 多模态是人类认为好,但是现在技术发展并没有明显证据表明多模态有特别好的表现。
: 模态多了,对很算法看来是干扰项。
如果莫太多了是干扰,那现在纯视觉方案增加清晰度的时候,信息量也是增加的,这个和增加模态是等同的,就是输入给智加系统的信息多了,是干扰么?
有人说多模态信息不一致,单模态信息也是依照概率产生不一致的呀,不是有特斯拉把前面车尾的红色丝带认为是雪糕桶么?
实际上对于已有算法和算力来说来说,清晰度增加,运算量增加,就是“干扰”。重复冗余信息更多,这就是“干扰”
如果认为单模态好的,那最佳的方法是雷达和激光,因为对于行车来说,除了信号灯和交通标志,物体的“颜色”毫无意义,反而是干扰(参考美国那几次特斯拉撞白色集装箱);只需要物体位置、速度信息,因为自己的车需要避开它,至于它是什么颜色,是人还是岩石,有区别么?
:
: ...................
--
FROM 14.154.124.*