- 主题:半个外行谈谈我的看法,供讨论了批判
不知为啥发不出来就传图片吧
--
FROM 120.244.234.*
感谢你的分享
如果像你所说,的确跟我司在电路仿真EDA这方向的情况还挺类似。Cadence和synopsis早就有了业界非常成熟的电路仿真器,但限于传统的架构路径依赖,他们只是小修小补,在没有市场刺激的情况是不会主动去对架构进行大的调整。
国产仿真器发展较晚,但是通过研究,我们打磨适配了几种新方法,包括新的lu分解方案和新的电路参数简并的更高效办法,实际上这办法原理国外eda相关论文里早有论述,但是CS限于自身的原因没采用和进一步发展,这就给了我们后来居上的可能性。
但是我们这走通以后,最近几年cadence也推出了自己的下一代仿真,性能也就一下子追上来了,所以任何技术也是不断迭代竞争发展。
【 在 anylinkin 的大作中提到: 】
: 大公司也在对模型做裁减优化啊,他们也采取Pruning(裁减)、通过量化(缩小参数精
: 度)等等方式做基于自己完整大模型的各种小模型,用于各种特定场合。只是这部分工
: 作目前主要是集中在几个大模型自己那里做(他们都有自己的产品模型),外人不好直
: ...................
--
FROM 120.244.234.*
你的观点也很有意思,但是我认为像结论还尚早。ds出现证明了可以用低廉成本通过算法创新获得类似目前o1等同的效果,但是如果是使用md的大力飞砖再加上ds的新算法呢?会不会有更大的飞跃?这目前还没有答案,但是验证这件事花不了多久,毕竟ds开源了,估计几个星期就会有说法,我们拭目以待吧。
一个在半导体这边类似的例子是先进封装chiplet,这个架构原本是为了平摊大规模IC的成本,后来AI出现了,发现这个架构恰好很适合于近存计算、打破存储墙,再后来中国突然发现,通过在立体方向堆叠较落后工艺的芯片,也有可能逼近先进工艺平面芯片的系统性能,所以一下子成为这两年半导体研究的热点。但这还是绕不开一个问题:如果我用本来最先进工艺的平面芯片在加上先进封装堆叠,不是又可以得到更为先进的系统能力吗?
【 在 poggy 的大作中提到: 】
:
: 神经网络虽然取得了很大成效, 集中在网络结构设计和优化算法, 数值计算稳定性。
: 但是, 对于网络结构的动态变化, 也只是让一部分网络进入抑制状态(相当于网络被缩减),
: ...................
--
FROM 120.244.234.*
觉得ds的路子可能才是ai更合适的形态,因为moe机制更类似人脑的思考过程,人是有注意力机制的,无论是在那种情景下,比如观察、思考、计算、谋划,它都会自动的只去关心对结果可能影响力最大的那些参量,所以这样才能保证大脑在维持只有极低能耗的时候(一天两馒头足够),却能做出极为精准的判断。
【 在 poggy 的大作中提到: 】
:
: 垂直说白了, 就是分化型, 人类也一样, 样样通, 不如一样精,
: 这个问题有的时候也很奇怪, 能做到样样通的, 偏偏是建立在一样精上,
: ...................
--
FROM 120.244.234.*