水木社区手机版
首页
|版面-人工智能(AI)|
新版wap站已上线
返回
1/1
|
转到
主题:用transformer模型去处理如此简单的问题,是不是太浪费了?唉。
楼主
|
feng321
|
2024-07-09 21:29:47
|
只看此ID
这篇博客,要解决的问题是"我们可以从一个简单的复述任务开始。给定在一个小词汇表里的随机输入序列,目标是生成返回相同的序列。"——————目标是生成返回相同的序列,这么简单的需求,有必要用 transform模型吗?还翻译字Harvard的,也不知道作者怎么想的?大家说呢?
--
FROM 39.146.79.*
1楼
|
feng321
|
2024-07-09 21:30:51
|
只看此ID
【 在 feng321 的大作中提到: 】
: 这篇博客,要解决的问题是"我们可以从一个简单的复述任务开始。给定在一个小词汇表里的随机输入序列,目标是生成返回相同的序列。"——————目标是生成返回相同的序列,这么简单的需求,有必要用 transform模型吗?还翻译字Harvard的,也不知道作者怎么想的?大家说呢?
--
FROM 39.146.79.*
2楼
|
feng321
|
2024-07-10 18:30:01
|
只看此ID
没人关注这个吗?链接发不上来
【 在 feng321 的大作中提到: 】
: [upload=1][/upload]
--
FROM 39.146.79.*
3楼
|
whistlingMe
|
2024-07-10 18:53:53
|
只看此ID
巧了,目前所有号称能替代transformer的架构比如Mamba,就是做不好复述任务。
--
FROM 114.254.2.*
4楼
|
feng321
|
2024-07-10 19:22:36
|
只看此ID
直接复制,不就行了吗?
【 在 whistlingMe 的大作中提到: 】
: 巧了,目前所有号称能替代transformer的架构比如Mamba,就是做不好复述任务。
--
FROM 39.146.79.*
1/1
|
转到
选择讨论区
首页
|
分区
|
热推
BYR-Team
©
2010.
KBS Dev-Team
©
2011
登录完整版