- 主题:外行求科普:几十亿参数的参数具体指什么?
对,大数据、高算力是大模型的前提。
【 在 q6329 的大作中提到: 】
: 我觉得这个回复最合适,就是参数越多,你可以认为可以拟合的越准确,但是函数本身就越复杂,计算量越大。
--
FROM 223.72.40.*
这个还是在于科学理论的突破,人类的飞机比鸟类强大,并不是人类多么的了解鸟类,而是牛顿力学给明了飞机的动力学方法。
而真正的智力,人类现在的理论基本还是处于抓瞎阶段。就如openAI的那样,chatGPT已经快到头了,但是仍然无法完成简单的智力推理
【 在 qgg 的大作中提到: 】
: 人类搞的不一定比演化的差,就像飞机肯定没有鸟类精巧,用你的比较方法可以发现,鸟类的一个细胞都比现代喷气式飞机复杂,但喷气式发动机能量转化的规模比鸟类大得多,结果速度和距离都比鸟类强得多。类似的,电流和晶体管的速度比神经冲动和神经递质的速度快得多。
--
FROM 183.220.92.*
【 在 chunhui 的大作中提到: 】
: 哪位给科普一下。多谢。这些参数是具体指什么?参数是由什么划分出来的,根据什么来划分这些参数?
目前的所谓大模型, 一般就是指AI里的神经网络模型,
计算机科学的神经网络可以简单的理解为人脑的数字化,
怎么数字化比如两个神经元, 人类的神经是通过神经脉冲传导的,
数字化就是一个参数,也就是标记两个神经元连接强度的权值(常常用不同长度的浮点数表示),
另外, 除了这个连接权值, 一个神经元本身还有一个偏置值,
当然,这只是通常的一种神经元类型, 还会有更复杂的, 基于能量系统的,基于概率分布的仿真模型。
基本都是来源于物理或者数学。
本质上, 一个有很多层的神经网络, 就是一个复合很多次的深度复合函数,而函数的每个变量值
又是一个很多维度的向量, 这两者的数字化, 共同形成了一个超大的,复杂的矩阵。
而所谓的学习, 就是让输入的数据,经过这个复杂的复合函数后得到的输出的数据,与我们期望的目标结果之间产生关联, 需要通过改变这个复杂复合函数中
参数矩阵里面的参数值来实现的,其实,这个过程则是纯粹数学优化方法。至少现在看, 这个和人脑的进化和学习机理是不相干的。
--
修改:poggy FROM 124.126.1.*
FROM 124.126.1.*
【 在 qgg 的大作中提到: 】
: 人类搞的不一定比演化的差,就像飞机肯定没有鸟类精巧,用你的比较方法可以发现,鸟类的一个细胞都比现代喷气式飞机复杂,但喷气式发动机能量转化的规模比鸟类大得多,结果速度和距离都比鸟类强得多。类似的,电流和晶体管的速度比神经冲动和神经递质的速度快得多。
这个优化目标不一样, 人类的智商做出来的, 和大自然亿万年演化出来的,最大的区别是后者本身就是一个系统,有着自身完整的演化路径, 大自然的能效比, 远远高于人造的东西, 人类几个馒头的智能输出, 需要机器几万度电,长时间的输出。 还比如, 有一种鞭毛虫的微生物, 它的运动马达,其能效转换,让人造的电机完全相形见绌。
--
FROM 124.126.1.*
不好意思,您说的4个观点,我个人都持不同观点,欢迎探讨
1.您在17楼说“神经网络的命名是最大的失败,实际上跟生物的神经没有半毛关系”
实际上神经网络受到了非常强烈的人类神经研究启发
MP神经元的创建者之一沃伦·麦克洛克,就是神经生理学家
感知机的发明人也是心理学家
神经元之间的连接、神经元突触的强化增强,还有Hubb学习,都直接启发了人工神经网络和梯度下降算法
在后续的发展过程中,也有依靠动物视觉系统研究来启发网络结构的部分,都很直接
2.您在21楼说“动物的神经网络到现在人类还是两眼一抹黑,现在的神经网络就是泰勒级数展开的一种高级形式”
人类对动物神经网络的细粒度研究已经很清晰了
早在80年代就已经完成了一些虫类的神经回路完整分析和重构
2000年前后也已经完成了果蝇、老鼠等动物的大脑神经完整分析
神经网络作为万能拟合器,确实跟泰勒级数展开有相似性,但无论从复杂度、拟合能力还是优化方法来说,都远超泰勒级数展开
你这就好像对着搞密码学领域研究的人说:你们不就是四则运算的高级形式么。对,也不对。
3.您在26楼说“人工神经网络的单个神经元只有一个输出,比不上人脑神经细胞的多输入、多输出,人工神经网络已经陷入理论瓶颈了,应该多用显微镜观察人脑神经网络的放电方式”
这一点不仅跟您自己在17楼、21楼的观点相互冲突,承认了人工神经网络跟人脑的启发关系,但又陷入了另外一个极端
您错误地认为人工神经网络算法就必须走仿生路线,必须依靠人脑研究
在80年代的神经网络发展之中,奠定了几个重要的基础,偏偏与人脑无关,从而整体上使得人工神经网络走上了自己的道路
当然,行业里有一些大佬也会偶尔出来宣称要重回仿生路线,包括hinton,但只是做个姿态、再找一些启发的可能,而几乎没有可能在整体上回到仿生路线了
4.您在31楼说“人类的飞机比鸟类强大,并不是人类多么了解鸟类,而是牛顿力学给明了飞机的动力学方法”
这一点和您在26楼的观点相互冲突,认为没必要仿生而应该建立数学基础,但又陷入到了另外一个极端
关于这一点LeCun前几年反驳的比较多,主要是以万普尼克和乔丹为代表的老一代对神经网络时代的嫉妒而产生的攻击理由。但随着这几年的发展,逐渐少了很多这种无意义的讨论。
实际上人类至今都没有得到机翼相关的“给明了的动力学方法”
伯努利那些明显过于简化的方法就不提了,比较终极的N-S方程至今都是数学前沿难解的问题之一,再复杂一些的机翼场景甚至连数值模拟都很难做准确,所以最后还是靠实体实验
【 在 zuigao 的大作中提到: 】
: 这个还是在于科学理论的突破,人类的飞机比鸟类强大,并不是人类多么的了解鸟类,而是牛顿力学给明了飞机的动力学方法。
: 而真正的智力,人类现在的理论基本还是处于抓瞎阶段。就如openAI的那样,chatGPT已经快到头了,但是仍然无法完成简单的智力推理
:
: ...................
--
修改:ni1 FROM 123.112.67.*
FROM 123.112.67.*
给这个回帖点赞。 说得对不对不管,这种认真讨论问题的态度很赞赏。哈哈
【 在 ni1 (ni1) 的大作中提到: 】
: 发信人: ni1 (ni1), 信区: AI
: 标 题: Re: 外行求科普:几十亿参数的参数具体指什么?
: 发信站: 水木社区 (Wed Dec 6 23:17:35 2023), 站内 [累计积分奖励: 0/99]
:
--
FROM 222.129.3.*
这个 很多维度的向量 维度都加起来就是参数数量?这些向量数是不是对应的神经元链接数?
【 在 poggy 的大作中提到: 】
:
: 目前的所谓大模型, 一般就是指AI里的神经网络模型,
: 计算机科学的神经网络可以简单的理解为人脑的数字化,
: ...................
--
FROM 114.254.3.*
参数简单来讲就是乘加系数,abcdefg之类就行
【 在 chunhui 的大作中提到: 】
: 哪位给科普一下。多谢。这些参数是具体指什么?参数是由什么划分出来的,根据什么来划分这些参数?
- 来自 水木社区APP v3.5.7
--
FROM 120.244.224.*
【 在 chunhui 的大作中提到: 】
: 这个 很多维度的向量 维度都加起来就是参数数量?这些向量数是不是对应的神经元链接数?
这个维度, 你可以认为是不同的属性, 比如颜色, 会有红,黄, 蓝, 透明度之类的。
一个物品, 会有长宽高,重量, 价格, 制造时间, 保质期, 成本等等的。
一个人也类似。
每一个物品的总和构成一个样本集, 模型就建立在这个样本集的拟合上, 样本和维度是连乘的关系,而不是简单相加。
至于这些维度换算关系, 并不需要有严格限定,不同的网络结构设计可以不一样。
还是以颜色为例, 你有一副图, 有一万个像素, 每个像素有红绿蓝和透明度特征。
你可以输入设计成10000, 却有四个通道的网络, 通道网络之间相互独立,
你也可以设计出10000x4的输入, 四个特征融合到一起,都在一层,构成一张网络, 这样通道之间就不是相互独立了。
--
FROM 115.171.245.*
据说chatgpt-4的参数已经达到万亿,距离人类大脑只差一个数量级?
【 在 finlab 的大作中提到: 】
: 他们回答的都不形象。
: 目前主流的人工智能模式是人工神经网络。
: 大模型就是大规模多层人工神经网络。
: ...................
--
FROM 120.244.237.*