- 主题:著名大模型中用到的一个位置编码是一个国内二流学校硕士提出的
21年的文章
好像还是个90后,谷歌和Meta在大模型中都用了他的方法,牛啊!有这么一篇文章在高校的话可以到处吹了吧
--
FROM 171.218.192.*
是不是顶刊?不然有啥可吹的。我们领域,清华的某人发了一篇引用几千次的重量级文章的清华也不认,只认顶刊,最后连位置都保不住,灰溜溜归海了。清华都如此,更别说其他高校了。
【 在 hsing 的大作中提到: 】
: 21年的文章
: 好像还是个90后,谷歌和Meta在大模型中都用了他的方法,牛啊!有这么一篇文章在高校的话可以到处吹了吧
--
FROM 114.222.170.*
人家没发期刊呀,光发了预印。
就这Meta Google 的最流行大模型还有其他一些不是那么知名的大模型都用了这一算法就够99%教授摸不到了。。
【 在 zfbdcyj 的大作中提到: 】
: 是不是顶刊?不然有啥可吹的。我们领域,清华的某人发了一篇引用几千次的重量级文章的清华也不认,只认顶刊,最后连位置都保不住,灰溜溜归海了。清华都如此,更别说其他高校了。
:
--
FROM 171.218.192.*
那不更完了?连篇文章都不算。
【 在 hsing 的大作中提到: 】
: 人家没发期刊呀,光发了预印。
: 就这Meta Google 的最流行大模型还有其他一些不是那么知名的大模型都用了这一算法就够99%教授摸不到了。。
: :
--
FROM 114.222.170.*
真的牛人,不需要这些虚无的标签,有货没货拉出来走走
【 在 zfbdcyj 的大作中提到: 】
: 是不是顶刊?不然有啥可吹的。我们领域,清华的某人发了一篇引用几千次的重量级文章的清华也不认,只认顶刊,最后连位置都保不住,灰溜溜归海了。清华都如此,更别说其他高校了。
:
--
FROM 183.173.88.*
那有屁用。在高校是龙你给我盘着,是虎你给我卧着。现在认得是帽子。帽子看的是人脉背景项目,顶刊还有点作用。其他的都是浮云。领导看你有货没货是有没有帽子,有没有大项目,至少也有几篇顶刊。不然你就是虚无的标签,没啥实货。
【 在 redaiyu 的大作中提到: 】
: 真的牛人,不需要这些虚无的标签,有货没货拉出来走走
:
--
FROM 210.29.134.*
发下链接
【 在 hsing 的大作中提到: 】
: 21年的文章
: 好像还是个90后,谷歌和Meta在大模型中都用了他的方法,牛啊!有这么一篇文章在高校的话可以到处吹了吧
--
FROM 124.127.221.*
ROFORMER: ENHANCED TRANSFORMER WITH ROTARY POSITION EMBEDDING
Rotary Position Embedding,RoPE
现在主流大模型都用这个实现位置编码
【 在 stoneyang 的大作中提到: 】
: 发下链接
--
FROM 183.220.108.*
位置都保不住归海是啥意思?清华劝退?
【 在 zfbdcyj 的大作中提到: 】
: 是不是顶刊?不然有啥可吹的。我们领域,清华的某人发了一篇引用几千次的重量级文章的清华也不认,只认顶刊,最后连位置都保不住,灰溜溜归海了。清华都如此,更别说其他高校了。
:
--
FROM 117.40.134.*
对啊。过不了考核,另一个发了影响力极小的顶刊文章的过了。他一怒之下回国外了,现在在美国某校当副教授。
【 在 sayde 的大作中提到: 】
: 位置都保不住归海是啥意思?清华劝退?
:
--
FROM 210.29.134.*