嗯。
“围棋AI的训练目标是在人类常见棋局分布上表现最优,而对抗样本是人为构造的分布外
(OOD)输入。
提升OOD鲁棒性通常需要牺牲标准分布上的性能(例如,模型变得更谨慎,但对常规棋局
胜率下降)。
这类bug的持久性提醒我们:AI的“超人类”能力可能仅限于特定分布,而非真正的通用智能。”
【 在 sfyz 的大作中提到: 】
: 之前有发现环形攻击策略,goattack . far . ai 这个网站说用了各种防御策略,还是没有彻底修复。
: 参考这个 GitHub repo: AlignmentResearch/go_attack
--
FROM 112.47.225.*