跨模态对齐、融合,5年前就听说过这个词了,到今年还没显著进展呀?太奇怪了。
【 在 qtpr 的大作中提到: 】
: 1 现有AI架构下,视觉和激光雷达这两个数据模态无法有效融合,引入激光雷达并不能在全场景下稳定提升视觉方案的安全性,有些场景下还会起副作用。
: 2 以上结论是基于现有AI架构得出的。但是,人类司机都天生会多模态数据融合——人类司机能够有效依靠视觉和听觉信息来驾驶。所以,现有AI架构与人类智能之间存在显著的差异。更通俗滴说,现在AI并不能像人类那样判断和思考。
--
FROM 1.202.70.*