【 在 chunhui 的大作中提到: 】
: 哪位给科普一下。多谢。这些参数是具体指什么?参数是由什么划分出来的,根据什么来划分这些参数?
目前的所谓大模型, 一般就是指AI里的神经网络模型,
计算机科学的神经网络可以简单的理解为人脑的数字化,
怎么数字化比如两个神经元, 人类的神经是通过神经脉冲传导的,
数字化就是一个参数,也就是标记两个神经元连接强度的权值(常常用不同长度的浮点数表示),
另外, 除了这个连接权值, 一个神经元本身还有一个偏置值,
当然,这只是通常的一种神经元类型, 还会有更复杂的, 基于能量系统的,基于概率分布的仿真模型。
基本都是来源于物理或者数学。
本质上, 一个有很多层的神经网络, 就是一个复合很多次的深度复合函数,而函数的每个变量值
又是一个很多维度的向量, 这两者的数字化, 共同形成了一个超大的,复杂的矩阵。
而所谓的学习, 就是让输入的数据,经过这个复杂的复合函数后得到的输出的数据,与我们期望的目标结果之间产生关联, 需要通过改变这个复杂复合函数中
参数矩阵里面的参数值来实现的,其实,这个过程则是纯粹数学优化方法。至少现在看, 这个和人脑的进化和学习机理是不相干的。
--
修改:poggy FROM 124.126.1.*
FROM 124.126.1.*