水木社区手机版
首页
|版面-编程技术(Programming)|
新版wap站已上线
返回
1/1
|
转到
主题:Fiction.liveBench August 8 2025
楼主
|
adamhj
|
2025-08-15 17:20:57
|
只看此ID
感觉这个测试才最能衡量大模型在编程中的能力,很多模型稍微上下文长一点点就开始各种犯蠢,完全没法用
--
修改:adamhj FROM 182.85.140.*
FROM 182.85.140.*
1/1
|
转到
选择讨论区
首页
|
分区
|
热推
BYR-Team
©
2010.
KBS Dev-Team
©
2011
登录完整版