从思考输出的分析来说,是串行的,不知道内部分析是不是并行的,甚至,应该用超大参数方式并行分析才符合现实吧。
【 在 anylinkin 的大作中提到: 】
: outcome award RL,不是创新,而且不少人认为不如process award强化学习
: 。稀疏激活MOE(就是只激活部分参数运算),是新的研究领域,但也不是它创新的,算
: 是比较早的应用,目前这个领域还有很多需要解决的问题,存在局限。但是这两点,本
: ...................
--
FROM 223.198.81.*