- 主题:转载:特斯拉AI Day前瞻:纯视觉FSD背后的哲学
自动标注确实NB,我们之前做模型,最大的成本就是数据标注,尽管开发了不少数据标注工具,但依然需要依靠人力来进行标注或依靠人力来确认机器完成的标注,这个过程没法自动化,没法闭环,数据量越大,标注成本就越高,最终受制于成本,很多数据被白白丢弃,并没有喂给模型训练程序。
【 在 dalezzz 的大作中提到: 】
: 不管纯视觉的天花板在哪里,tsl做事是让人敬佩的。
: 以下原文:
: 根据马斯克的预告,一个月之后,特斯拉 2021 AI Day 就将到来。
: ...................
--
FROM 223.71.143.*
无论是摄像头还是雷达,都是电磁波传感器,区别仅在于频率。摄像头工作在可见光频段,雷达工作在毫米波频段,激光雷达工作在或红外光频段。
至于分辨率,不知道毫米波雷达和激光雷达分辨率是多少,难不成做不到720p ?
【 在 dalezzz 的大作中提到: 】
: 1、现在看,纯视觉还没有天花板,以后那还不知道。
: 2、从文章的意思,采集不是问题,720p足够了,识别才是重点,单机能力未来能不能够用不确定,所以有超算压阵
--
FROM 223.71.143.*
按说不应该冲突。
【 在 west 的大作中提到: 】
: 当视觉和其它传感器的结论冲突时,你更相信谁?
: 视觉获取的信息数据率远远大于其它任何传感器
:
--
FROM 223.71.143.*
也不能绝对相信摄像头,毕竟摄像头曾经把白色卡车识别成蓝天白云。
而且就算人眼,也有看错的时候。
【 在 west 的大作中提到: 】
: 当视觉和其它传感器的结论冲突时,你更相信谁?
: 视觉获取的信息数据率远远大于其它任何传感器
:
--
FROM 223.71.143.*
自动驾驶这块儿还有些特殊,因为有大量人肉司机的存在。
司机在手动驾驶的时候,给车辆发出的动作,例如转向、加速、减速,这些都可以视为「人工标注」,虽然并不是直接在图形里手工把不同物体圈出来,但也可以建立某种图像——动作之间的关联映射。
只不过有一些无效动作需要剔除,例如司机到达目的地后减速靠边停车,这个并不是「避让障碍物」,这种标注就没意义,可能需要剔除。
【 在 ia 的大作中提到: 】
: 基本不存在自动标注这事吧。
: 如果能自动标注了,那么这个标注工具实际上已经能接近100%理解场景了,能100%理解场景了,那么已经不需要标注了...标注的目的就是为了模型去学习如何理解场景。
: 目前全世界搞机器学习的都需要人工介入标注,没道理特斯拉领先整个行业一大步,而没有被整个行业学习和模仿。
: ...................
--
FROM 223.71.143.*