跟训练数据有关
当你的训练数据是:Apple --> 苹果
假设只有这一条训练数据。模型在推理的时候,
当你输入:Apple,decode会从字典里找最可能的对应序列。字典的内容就是你说的大量的词典表,有汉字,有单词,有日文,有标点符号,有等等的字典
然后模型发现:苹果的输出概率最高。它就输出了苹果
在用户看来,我们实现了翻译的过程
【 在 johnfader 的大作中提到: 】
: transformer模型做翻译的时候,encoder之后,变成word2vec词料库的向量,
: 又是如何decoder到目标语言的?decoder是何时指定目标语言的?词料库里面有不同语言的数据吗?是不是一条向量可以从词料库里面按参数选出不同语言的词汇?
--
FROM 112.97.63.*