- 主题:告诉你们为啥现在放FSD进来
你平时走路主要靠眼睛,难道捂住耳朵关闭听力能走的更流畅?
端到端大模型时代根本不存在 “二者出矛盾的时候到底听谁的” 这个问题。输入就是越多越好。
--
FROM 210.12.43.*
你这类比不准确,按照你这么说,纯视觉也应该只有一个摄像头...
而且都说了,端到端不存在决策问题。 人类走路靠视觉就能解决90%,加上听力只会走的更好。听力和视觉有矛盾时,人类大脑本来也会自动兼容,多了一个安全保障。
【 在 baski 的大作中提到: 】
: 问题雷达和视频不是眼睛和耳朵,而是左眼和右眼看到的东西不一样大脑听谁的问题。
:
--
FROM 210.12.43.*
你走路时眼睛和耳朵会打架吗?
捂住耳朵会走的更稳吗?
【 在 baski 的大作中提到: 】
: 纯视觉的摄像头不会打架,是AND不是OR的关系。
--
FROM 210.12.43.*
... 至少类似,(实际上我认为深度学习比人类大脑上限更高)
端到端深度学习, 视力可以解决90%没问题, 但是视力+听力一定大于90%,分歧不过是91%还是95%。
其实我认为是97%
【 在 S030371 的大作中提到: 】
: 可惜深度学习不是人类大脑
--
FROM 210.12.43.*
1、实际上我是极端的“自动驾驶”反对者,至少2025年3月份当前所有的智驾都是垃圾。
2、人类对自己的智力自豪感,只是一种可怜的不甘的呻吟,2025年迄今科学的发展已经有太多的证据表明人类大脑不是什么奇迹,甚至自我意识也不过是一种幻觉,没有灵魂,甚至没有自由意识。如果说不可思议,那也是人类大脑参数远大于现在ChatGPT、DeepSeek各种模型,但也只是一种非常非常大的AI模型。
【 在 S030371 的大作中提到: 】
: 做梦
: 人类大脑是造物主的神迹
--
FROM 210.12.43.*
人类对于自己智商的优越感只是一种不甘的呻吟,而且也呻吟不了几十年了,归根结底是接受不了人类没有灵魂这个事实。
ps:实际上我目前是极端的自动驾驶反对者。都是垃圾,不管是不是纯视觉。
【 在 fhn 的大作中提到: 】
: 什么深度,参数,模型,训练都是扯蛋,没啥大用。
: 识别完成了就到了执行动作的程序,不是if就是else,一旦都不是,智驾就傻眼,按最后统一的一个方案去处理,听天由命吧。
: 程序永远不像人灵活,它只能做有限的规定动作。
: ...................
--
FROM 210.12.43.*
和算力没关系,最初级手机能跑的模型都能处理多种输入。
有关系的是数据,只有训练数据量够,模型自然会学会怎么平衡视觉、激光、声波。
大脑走路时同时利用视觉和听力,也就小脑里很小一部分算力而已。
【 在 kettle 的大作中提到: 】
: 算力不够啊,就像新手开车本来就不顺溜,你再拿个大喇叭在边上喊他就就会开了吗
: 发自「今日水木 on iPhone 15 Plus」
--
FROM 210.12.43.*
你去随便选个机器学习教程,运行教程里的第一个demo,看看有没有if else
即使没有端到端模型的上古时代,真用if else时,多加传感器也从来没有降低过系统准确率。
只是端到端时代还可以大幅提高多传感器的优势
真像你说的,纯视觉也只能用一个摄像头,用两个if else没法写啊
【 在 fhn 的大作中提到: 】
: 训练,模型都是离线干的事,即时场景下识别和决策都是if else语句, 只能处理有限场景。
: else不包括的场景智障必然傻眼。视觉,激光都只是增加识别成功率,但if层数是有限的,它和人没法比灵活性。
: 实际是啥情况都有,还见过引擎盖没扣上,高速给吹翻起来的。
: ...................
--
FROM 210.12.43.*
…即使只有一层的机器学习模型,也至少是个高维的线性方程组,深层加入激活函数后的模型完全是黑盒子了。
如果你能说清楚模型内部怎么构造if else的,那随随便便拿个图灵奖,鉴于去年情况,现在诺贝尔奖也有可能了
【 在 fhn 的大作中提到: 】
: 那你车上的8295上跑的是什么指令,除了顺序执行的,不就是跳转吗,最后一个分支判断完了去哪里?
: 训练可以离线,现场 是实时处置。
:
--
FROM 210.12.43.*
有关系,DeepSeek用8295都能跑,就是特别特别慢而已。
机器学习几十年多少人都在搞明白这问题
【 在 fhn 的大作中提到: 】
: 8295上跑的是固化的arm汇编指令,简化一下,就是顺序语句和if,这些 if只能处理有限场景,程序是固化的,不可能处理程序员都没有想到的场景,而人可以灵活些。
: 这是我的观点。和图灵,高维没关系,不用扯那么远,
:
--
FROM 114.254.0.*