数学界拉了60多个数学家在11月刚整了一个FrontierMath,想给LLM竖立一座高墙。
当时最强的LLM在FrontierMath上通过率只有2%。
然后媒体开始各种宣告AI还需要n年时间才能攻克这个榜单。
仅仅1个月之后,现在o3在FrontierMath上的通过率是25%
贴点题目给大家看看。
【 在 District9 的大作中提到: 】
: AI现在的进展是一日千里,一年前的水平和六个月前可能差距10倍,而六个月前和现在又差10倍。另外国内和国外顶尖的差距颇大,而且有被越拉越开的趋势。现在顶尖的ai基本都可以做到几句话就可以输出完整程序一遍通过,顶多就是需要对一些业务逻辑进行微调。
: 现在比较乐观的估计是2025年agi会出现,agi就是可以完全取代人类工作,而马农会是第一批被取代的工种。
--
修改:lvsoft FROM 117.135.82.*
FROM 117.135.82.*