这种简单的加法还需要用数据集去做训练?我还以为是独立的算法 【 在 LouisaSquare 的大作中提到: 】 : 有一大类问题叫做Compositional Task,说得都是语言模型的局限。比如以下论文: : On the Paradox of Learning to Reason from data, 2022 (https://arxiv.org/pdf/2108.04378.pdf) : Making Transformers Solve Compositional Tasks, 2022 (https://arxiv.org/pdf/2205.11502.pdf) : ................... -- FROM 114.249.130.*