- 主题:外行求科普:几十亿参数的参数具体指什么?
哪位给科普一下。多谢。这些参数是具体指什么?参数是由什么划分出来的,根据什么来划分这些参数?
--
修改:chunhui FROM 117.133.52.*
FROM 117.133.52.*
最简单的一种模型是outut=fn(...f2(f1(input)*w1)*w2)*wn
其中,w1、w2……wn是矩阵,这些就是参数
这些参数通过训练得来,通常是通过反向传播来计算出来
【 在 chunhui 的大作中提到: 】
: 哪位给科普一下。多谢。这些参数是具体指什么?参数是由什么划分出来的,根据什么来划分这些参数?
--
FROM 121.35.45.*
这个矩阵是根据什么定义的? 如果说1亿参数,那就是一亿个矩阵?那这么多矩阵应该也不是人一个个定义出来的吧?
【 在 letdown 的大作中提到: 】
: 最简单的一种模型是outut=fn(...f2(f1(input)*w1)*w2)*wn
: 其中,w1、w2……wn是矩阵,这些就是参数
: 这些参数通过训练得来,通常是通过反向传播来计算出来
: ...................
--
FROM 117.133.52.*
一个矩阵比如:200*2000,那么就是200*2000个参数。300个矩阵就是300*200*2000个参数
【 在 chunhui 的大作中提到: 】
: 这个矩阵是根据什么定义的? 如果说1亿参数,那就是一亿个矩阵?那这么多矩阵应该也不是人一个个定义出来的吧?
--
FROM 121.35.45.*
那矩阵是根据什么定义的?
比如处理一段文本。是否可以这样理解:每个文字相关的特性会被区分出来。比如:发音、单个文字出现的位置,文字的顺序。。。这些是否会被转化成矩阵?如果不是,那矩阵所代表的是文本的什么?
我这个问题如果解释起来很麻烦的话,有没有相关的介绍资料推荐?
【 在 letdown 的大作中提到: 】
: 一个矩阵比如:200*2000,那么就是200*2000个参数。300个矩阵就是300*200*2000个参数
--
FROM 117.133.52.*
那你这个要学的东西就要好多了。
往大的说,你可以搜索学习一下NLP,往小的说你可以学一下tokenization
虽然很多人喜欢推荐coursera上那个谁的讲的课程,但是,我个人推荐入门的话可以看youtube 王树森 的课程,我觉得他讲的更好
【 在 chunhui 的大作中提到: 】
: 那矩阵是根据什么定义的?
: 比如处理一段文本。是否可以这样理解:每个文字相关的特性会被区分出来。比如:发音、单个文字出现的位置,文字的顺序。。。这些是否会被转化成矩阵?如果不是,那矩阵所代表的是文本的什么?
: 我这个问题如果解释起来很麻烦的话,有没有相关的介绍资料推荐?
--
FROM 121.35.46.*
他们回答的都不形象。
目前主流的人工智能模式是人工神经网络。
大模型就是大规模多层人工神经网络。
实际上非常简单。就是模拟人类大脑的构成
一个节点代表一个神经元,一个神经元通过轴突和树突与其他神经元接受和发送信息。
人工神经元的一个参数就是两个神经元之间的神经链接。
人工神经网络再60年代的时候就热过,不过当时算力很弱,只能局限于很小规模
的有限层数的网络。
随着算力的增长,现在大规模人工神经网络的训练成为可能,于是各种基于大规模神经网络的应用开始涌现
这个大规模什么概念?
人类大脑大概有10^11的神经元,10^13的神经连接
相当于10^11个节点,10^13的参数。
所以,要达到人脑复杂度,需要10万亿参数的大模型。
【 在 chunhui 的大作中提到: 】
: 哪位给科普一下。多谢。这些参数是具体指什么?参数是由什么划分出来的,根据什么来划分这些参数?
--
FROM 223.72.40.*
你这个不如楼上函数和参数矩阵举例的兄弟的形象。
【 在 finlab 的大作中提到: 】
:
: 他们回答的都不形象。
:
: 目前主流的人工智能模式是人工神经网络。
: 大模型就是大规模多层人工神经网络。
#发自zSMTH@LNA-AL00
--
FROM 117.136.0.*
我只是突然好奇。系统学习没这个需要。有没有科普性质的资料看看。知道大概意思就行了。
【 在 letdown 的大作中提到: 】
: 那你这个要学的东西就要好多了。
: 往大的说,你可以搜索学习一下NLP,往小的说你可以学一下tokenization
: 虽然很多人喜欢推荐coursera上那个谁的讲的课程,但是,我个人推荐入门的话可以看youtube 王树森 的课程,我觉得他讲的更好
: ...................
--
FROM 117.133.52.*
所以说,这个”参数“指的是模拟神经元的个数?
【 在 finlab 的大作中提到: 】
: 他们回答的都不形象。
: 目前主流的人工智能模式是人工神经网络。
: 大模型就是大规模多层人工神经网络。
: ...................
--
FROM 117.133.52.*