- 主题:attenion 里的Q,K,V参数是怎么训练出来的
查了半天都没说这几个参数咋训练的,语料是怎么准备的,需要怎么标注等等
--
FROM 223.72.208.*
Q K V 是三类矩阵,它们的参数都属于神经网络的范畴,因此训练神经网络的时候,所有参数都有会发生变化,包括三类矩阵的参数。
--
FROM 114.246.111.*
是监督训练么,需要人工标注么
【 在 dreamr 的大作中提到: 】
:
: Q K V 是三类矩阵,它们的参数都属于神经网络的范畴,因此训练神经网络的时候,所有参数都有会发生变化,包括三类矩阵的参数。
: --
: 如果开始回忆过去,说明你正在变老
:
发自「今日水木 on V2178A」
--
FROM 221.223.194.*
先理解embedding, Q,K都算embedding?
【 在 juda 的大作中提到: 】
: 查了半天都没说这几个参数咋训练的,语料是怎么准备的,需要怎么标注等等
--
FROM 119.123.197.*
预训练阶段不需要人工标注,基础模型训练出来之后还要精调,这时才需要用到人工标注的数据
【 在 juda 的大作中提到: 】
: 是监督训练么,需要人工标注么
: 发自「今日水木 on V2178A」
--
FROM 114.246.111.*
你可以参考karpathy的教学项目llm.c
【 在 juda 的大作中提到: 】
: 查了半天都没说这几个参数咋训练的,语料是怎么准备的,需要怎么标注等等
--
FROM 125.38.176.*