“有人说多模态信息不一致,单模态信息也是依照概率产生不一致的呀,不是有特斯拉把前面车尾的红色丝带认为是雪糕桶么?”
------------------------------
^^^^^^^^
你说的这个,是不是有一种可能是,现在无论是哪种单/多模态,都不可能做得那么好啊?
不是说单模态太那么好,多模态就好了。我想说明的是,多模态并不是救星。
如果认为单模态好的,那最佳的方法是雷达和激光,因为对于行车来说,除了信号灯和交通标志,物体的“颜色”毫无意义,反而是干扰(参考美国那几次特斯拉撞白色集装箱);只需要物体位置、速度信息,因为自己的车需要避开它,至于它是什么颜色,是人还是岩石,有区别么?
-------------------------------------
现在并没有万能公式说什么好。可能在有的场景,黑白视频识别高、有的彩色高,有的多模态好,有的单色好。
我一贯观点,合理使用辅助驾驶,不要迷恋。
【 在 missinfailed 的大作中提到: 】
: 如果莫太多了是干扰,那现在纯视觉方案增加清晰度的时候,信息量也是增加的,这个和增加模态是等同的,就是输入给智加系统的信息多了,是干扰么?
: 有人说多模态信息不一致,单模态信息也是依照概率产生不一致的呀,不是有特斯拉把前面车尾的红色丝带认为是雪糕桶么?
: 实际上对于已有算法和算力来说来说,清晰度增加,运算量增加,就是“干扰”。重复冗余信息更多,这就是“干扰”
: ...................
--
FROM 59.51.191.*