这个时代值钱就是大家的想法和解决问题的方式

水木社区手机版

主题:这个时代值钱就是大家的想法和解决问题的方式
30楼|weiwallz|2026-03-27 16:00:04|只看此ID
这个可能你得核实一下，一次输入的激活的专家数量不是限定在1的
比如，你里面混杂了文本和代码，文本和图像，激活的可能都不是只有一个专家

【在 lvsoft 的大作中提到: 】
: 这个其实跟人类一样的。当你不懂这个问题的时候，你找的专家大概率也是偏的。
: 我觉得可以这么认为，你提出正确的问题这个行为本身，就激活了正确的专家。
: 【在 weiwallz 的大作中提到: 】
: : 这句话我十分赞成
: : 很多时候一旦你提出正确的问题，往往也意味着这个问题被解决了
: : 但我没明白，你说的问题，和MoE固有缺陷的关系？

--发自 ismth(丝滑版)
--
FROM 223.104.194.*
31楼|lvsoft|2026-03-27 17:21:42|只看此ID
我当然很清楚不是只激活一个专家，但没有意义啊。
比如说128个专家激活8个，跟8专家激活1个有啥区别？
重点不是激活多少个专家，重点是他是moe，它不激活所有的专家。

而且我其实也很反对这种把能力切开，变成一个个专家的模式。这就是我前面说的价值观，或者说世界观的问题。简单的说就是到底是通才更重要还是专才更重要。但这个话题太大了，三言两语讲不清就不展开了。
总之就是我不认为 MOE 是正确的路线，它只是一个 cost down 的路线。

【在 weiwallz 的大作中提到: 】
: 这个可能你得核实一下，一次输入的激活的专家数量不是限定在1的
: 比如，你里面混杂了文本和代码，文本和图像，激活的可能都不是只有一个专家
:
: ...................
--
修改:lvsoft FROM 116.233.45.*
FROM 116.233.45.*
32楼|weiwallz|2026-03-27 18:15:50|只看此ID
MoE主要动机确实是为了省cost的
FFN的参数量比attn层多的多

【在 lvsoft 的大作中提到: 】
: 我当然很清楚不是只激活一个专家，但没有意义啊。
: 比如说128个专家激活8个，跟8专家激活1个有啥区别？
: 重点不是激活多少个专家，重点是他是moe，它不激活所有的专家。
:
: 而且我其实也很反对这种把能力切开，变成一个个专家的模式。这就是我前面说的价值观，或者说世界观的问题。简单的说就是到底是通才更重要还是专才更重要。但这个话题太大了，三言两语讲不清就不展开了。
: 总之就是我不认为 MOE 是正确的路线，它只是一个 cost down 的路线。

--发自 ismth(丝滑版)
--
FROM 223.104.194.*
33楼|xeagle|2026-03-27 19:21:39|只看此ID
只能review+各种测试了吧，还能有啥好办法
【在 hgoldfish 的大作中提到: 】
: 反正这半年我是看明白了。
:
: 不懂程序的外行，用 AI 只能提出解决方案。
:
: 至于有没有效。天知道呢。
:
: 甚至现在 AI 给我写的代码，怎么验证也是个大问题。
: --
: 灭绝人性啊

发自「今日水木 on iOS」
--
FROM 221.222.20.*
34楼|lvsoft|2026-03-27 20:43:32|只看此ID
所以我就说这个是不对的。

一堆专家可以解决问题，但一堆专家不一定能提出问题。甚至一堆专家还容易把事情带带歪，把本来很简单的事情越搞越复杂。

解决这个问题需要的是系统级的架构师。架构师一般来说需要是通才而不是专才。越复杂的系统，这个通才的领域就越广。现在的AI，至少主流的都没有往这个方向发展。

不过也正常，因为大部分人都是专才，都是在一个体系里面去解决某个具体问题的人。AI先把这些人代替掉，这个替代过程是很顺滑的。这就是 OPUS 在干的事，也是大部分人喜欢 OPUS 的原因。因为 Opus 本质来说就是一个更优秀的他们。

【在 weiwallz 的大作中提到: 】
: MoE主要动机确实是为了省cost的
: FFN的参数量比attn层多的多
:
: ...................
--
FROM 116.233.45.*
35楼|hgoldfish|2026-03-27 23:56:40|只看此ID
这太低效了。要问好几个问题才能继续聊？说白了就是 AI 的上下文仍然严重不足。在做每个事情上，我们人类能够根据长期的观察，总结出很多上下文，在聊天时自动调用。

不过也可能是 AI 现有的缺陷，随着迭代次数的增加，以后会被修复。。

或许这是因为 AI 只学习了些人类的光明一面。还缺少对人类阴暗面的认知吧。

【在 weiwallz 的大作中提到: 】
: 你体会一下现在的gpt5.4或者opus 4.6，如果你的信息不足，它现在可能会主动问你，让你澄清的
: 说白了，这也是训练出来的行为，训练时有这样的内容不全，要模型输出提问的样本，那模型就能学会这种交流方式
: --发自 ismth(丝滑版)
: ...................
--
FROM 121.207.53.*
36楼|lvsoft|2026-03-28 00:20:24|只看此ID
不是的，这个跟上下文没有什么关系。现在的上下文已经足够做这个事儿了。
这个事情的本质还是注意力。
现在的模型可以轻松的背诵100万的上下文的内容，实现一个字不差。但是你真的把100万的内容喂进去，它会迷失方向的。

【在 hgoldfish 的大作中提到: 】
: 这太低效了。要问好几个问题才能继续聊？说白了就是 AI 的上下文仍然严重不足。在做每个事情上，我们人类能够根据长期的观察，总结出很多上下文，在聊天时自动调用。
: 不过也可能是 AI 现有的缺陷，随着迭代次数的增加，以后会被修复。。
: 或许这是因为 AI 只学习了些人类的光明一面。还缺少对人类阴暗面的认知吧。
: ...................
--
FROM 116.233.45.*
37楼|justgetit|2026-03-28 03:32:38|只看此ID
集中用了全人类智慧，那么对其课高税用于给全人类发福利也没毛病。而且要快。等那些公司尾大不掉成为巨无霸形态就要改变人类势态了。
--
FROM 111.193.141.*
38楼|niuya|2026-03-28 06:37:37|只看此ID
想法很多，五花八门，哪个真正有用，还是很费思量的
【在 hgoldfish 的大作中提到: 】
: 那再加个定语，有用的想法很值钱。
: 我现在深入介入观察实业生产，比如 3c 电子产业，他们想要设计出一个爆款出来是非常非常难的。不是说生产困难，对于中国这种工业克苏鲁国，生产制造一般是最简单的。而是找到用户需求的痛点，匹配到当前的潮流，又能符合互联网推广特征的，特别特别难。
: 这就是产业界所谓的“测款”。我手头的数据是，产业界这伙人，爆款成功率已经掉到不足 10% 了。要生产几十款，才能有一款产品是能卖的。
: ...................
--
FROM 58.57.159.*
39楼|radioham|2026-03-28 07:14:31|只看此ID
ai时代，行业内的系统工程师最值钱
--
FROM 36.112.177.*