越来越多的人对大模型和数据驱动的端到端产生了质疑

水木社区手机版

主题:越来越多的人对大模型和数据驱动的端到端产生了质疑
楼主|qtpr|2024-10-17 12:26:10|只看此ID
例如最近苹果团队发了一个文（附图1），结论是“大模型”并没有真正学会推理。最简单的例子，把一些小学水平应用题中的主角从Alice改成Bob，大模型的“计算”正确率就可能显著下降。这说明大模型并不真正理解应用题的题意，而只是机械地死记硬背了若干应用题而已。而且死记硬背得非常蹩脚，连主角改名这个trick都能让大模型失控。这种水准的智能，跟智障有何区别呢，呵呵。

另外，最近最近nature也有一篇论文（附图2），看题目就一目了然了——“大模型不可靠”。

做语言应用这种对准确率的要求不那么高的任务，都错漏百出可用性很差。这样的架构去做对可靠性要求很高的自动驾驶？呵呵

哄蒙最近的事故越来越多，快吹不下去了，这不是偶然的。因为这套架构之下，根本没法像水军吹嘘的那样——随着数据和算力的增加，问题和bug会自动解决。这样说的人，或者不懂，或者是真坏，呵呵。

--
FROM 111.167.232.*
1楼|frontier990|2024-10-17 12:27:15|只看此ID
竟然敢说哄萌，你不想混了？
--
FROM 111.1.72.*
2楼|mabuaa|2024-10-17 12:26:51|只看此ID
吹端到端最厉害的是tsl的fsd
ads3.0是分段式端到端，而且控制部分有基于规则的代码保底

【在 qtpr 的大作中提到: 】
: 例如最近苹果团队发了一个文（附图1），结论是“大模型”并没有真正学会推理。最简单的例子，把一些小学水平应用题中的主角从Alice改成Bob，大模型的“计算”正确率就可能显著下降。这说明大模型并不真正理解应用题的题意，而只是机械地死记硬背了若干应用题而已。而且死记硬
: 背得非常蹩脚，连主角改名这个trick都能让大模型失控。这种水准的智能，跟智障有何区别呢，呵呵。
: 另外，最近最近nature也有一篇论文（附图2），看题目就一目了然了——“大模型不可靠”。
: ...................
--
FROM 220.250.21.*
3楼|qtpr|2024-10-17 13:32:09|只看此ID
规则同样不是万能的，一阶逻辑不完备，二姐逻辑不可靠，呵呵

【在 mabuaa 的大作中提到: 】
: 吹端到端最厉害的是tsl的fsd
: ads3.0是分段式端到端，而且控制部分有基于规则的代码保底
:
--
FROM 111.167.232.*
4楼|mdkkurt|2024-10-17 13:41:04|只看此ID
牛批快要吹炸了

【在 qtpr (Transcendence constitutes selfhood.) 的大作中提到: 】
:  例如最近苹果团队发了一个文（附图1），结论是“大模型”并没有真正学会推理。最简单的例子，把一些小学水平应用题中的主角从Alice改成Bob，大模型的“计算”正确率就可能显著下降。这说明大模型并不真正理解应用题的题意，而只是机械地死记硬背了若干应用题而已。而且死记硬背得非常蹩脚，连主角改名这个trick都能让大模型失控。这种水准的智能，跟智障有何区别呢，呵呵。
:
:  另外，最近最近nature也有一篇论文（附图2），看题目就一目了然了——“大模型不可靠”。
:
--
FROM 139.215.45.*
5楼|wangstone|2024-10-17 14:55:57|只看此ID
你把他理解成机器学习好点。不一定是大模型
--
FROM 58.246.240.*
6楼|winsen|2024-10-17 14:58:23|只看此ID
目前基本路线就是规则+端到端，违规为主

【在 qtpr 的大作中提到: 】
: 规则同样不是万能的，一阶逻辑不完备，二姐逻辑不可靠，呵呵
:
--
FROM 218.17.205.*
7楼|JetLan|2024-10-17 15:27:42|只看此ID
你找错了对象吧，是tsl和理想汽车吹的最厉害，还靠智驾发布会。

【在 qtpr 的大作中提到: 】
: 例如最近苹果团队发了一个文（附图1），结论是“大模型”并没有真正学会推理。最简单的例子，把一些小学水平应用题中的主角从A ...
--
FROM 60.247.85.*
8楼|qtpr|2024-10-17 15:31:11|只看此ID
什么叫找错对象？任何厂家吹端到端和数据驱动，都是过度宣传，懂吗。

我跟你不一样，没主子。我只是消费者，懂吗。

【在 JetLan 的大作中提到: 】
: 你找错了对象吧，是tsl和理想汽车吹的最厉害，还靠智驾发布会。
:
--
FROM 111.167.232.*
9楼|algebub|2024-10-17 15:47:05|只看此ID
吹端到端的国外是tsl，国内是理想

怎么也轮也轮不到hw

【在 qtpr 的大作中提到: 】
: 例如最近苹果团队发了一个文（附图1），结论是“大模型”并没有真正学会推理。最简单的例子，把一些小学水平应用题中的主角从Alice改成Bob，大模型的“计算”正确率就可能显著下降。这说明大模型并不真正理解应用题的题意，而只是机械地死记硬背了若干应用题而已。而且死记硬背得非常蹩脚，连主角改名这个trick都能让大模型失控。这种水准的智能，跟智障有何区别呢，呵呵。
: 另外，最近最近nature也有一篇论文（附图2），看题目就一目了然了——“大模型不可靠”。
: 做语言应用这种对准确率的要求不那么高的任务，都错漏百出可用性很差。这样的架构去做对可靠性要求很高的自动驾驶？呵呵
: ...................
--
FROM 124.207.9.*