啊,这篇啊,这不就是个tech report吗,确实很有用,写的也还不错,但就只是个report,不能再多了,国内目前就这么僵化,就不会肯定他。。。。
【 在 hsing 的大作中提到: 】
: ROFORMER: ENHANCED TRANSFORMER WITH ROTARY POSITION EMBEDDING
: Rotary Position Embedding,RoPE
: 现在主流大模型都用这个实现位置编码
: ...................
--
FROM 125.33.200.*