http://www.flygo.net/bbs/forum.php?mod=viewthread&tid=114864本帖最后由 flyingsee 于 2021-8-24 11:32 编辑
根据崔灿五段的论文标注,我下载了其分析的全部棋谱。主要是要看一看,比赛胜负和AI吻合度的关系。
我讨论问题有一个
大前提:生活在同一时代棋手,围棋水平的高低以胜负论,胜者水平高,负者水平低。
大家赞不赞成?不赞成您可以不继续往下看。如果有人认为,有了AI吻合度这个“尺子”,就可以不用“胜负”这个最根本的衡量标准去衡量,那我也不用跟您继续讨论。
新发现的基本事实:AI吻合度与一局棋的胜负,不仅不存在必然的对应关系,而且在很大程度上,AI吻合度也不反映胜负关系。
我从崔灿五段整理分析过的棋谱里,筛选出常昊九段180手以上(因为崔老师就是按这个标准选的)的棋局共18局。
摘录数据如下(我没有做任何分析,仅仅是用katago打开了棋谱,棋谱是由崔老师分析完成的,我只需要读取数据就可以了):
常昊
对手
棋局
前180
全局平均
差
前180
全局平均
差
世界赛1
58.9
65
-6.1
31.1
50
-18.9
常昊败,全盘吻合度高于对手李昌镐
世界赛2
47.8
47.5
0.3
56.7
57.4
-0.7
常昊败
世界赛3
54.4
59.3
-4.9
54.4
58.9
-4.5
常昊败,全盘吻合度高于对手李昌镐
世界赛4
53.3
64.4
-11.1
54.4
56
-1.6
常昊败,全盘吻合度高于对手李昌镐
世界赛5
50
60.9
-10.9
40
53.3
-13.3
常昊败,全盘吻合度高于对手李昌镐
世界赛6
45.6
43.2
2.4
48.9
49.5
-0.6
常昊胜,全盘吻合度低于对手曹薰铉
世界赛7
50
50.8
-0.8
56.7
55.7
1
常昊败
世界赛8
53.3
56.5
-3.2
61.1
61.5
-0.4
常昊败
世界赛9
48.3
49.5
-1.2
58.4
58.8
-0.4
常昊败
世界赛10
57.8
58.4
-0.6
60
56.5
3.5
常昊败,全盘吻合度高于对手李世石
世界赛11
52.3
50.5
1.8
59.1
59.8
-0.7
常昊败
世界赛12
51.1
55.8
-4.7
53.3
52.2
1.1
常昊败,全盘吻合度高于对手崔哲瀚
世界赛13
55.6
60.6
-5
61.1
60.9
0.2
常昊胜,全盘吻合度低于对手崔哲瀚
世界赛14
51.1
55.5
-4.4
48.9
53.4
-4.5
常昊胜
世界赛15
60
65
-5
57.8
58.7
-0.9
常昊胜
世界赛16
63.3
65.3
-2
42.2
46.2
-4
常昊败,全盘吻合度高于对手古力
世界赛17
61.1
67.5
-6.4
57.8
63.3
-5.5
常昊胜
世界赛18
67.8
62.7
5.1
58.9
58.8
0.1
常昊败,全盘吻合度高于对手李世石
平均
54.539
57.689
-3.150
53.378
56.161
-2.783
18局比赛中,常昊负13局,胜5局。明显负多胜少。但常昊前180手平均AI吻合度54.539%,高于对手的53.378%;常昊全局的AI吻合度平均57.689%;高于对手平均56.161%。
特别是,比赛胜负结果与全盘所有手数的AI吻合度对比结果相反的,整整10局。
足以证明
一、AI吻合度与一局棋的胜负,不仅不存在必然的对应关系,而且,一定数据基础上的平均AI吻合度也不能反映胜负关系。
二、对于同一个时代的棋手来说,平均AI吻合度,不能直接证明胜负关系,也就是说,AI吻合度不能直接证明棋力水平的高低。
三、对于不同时代的棋手来说,AI吻合度更加无法间接证明棋力水平的高低。
四、崔灿老师的论文如果不解决上述问题,则整篇论文存在重大理论缺陷,所有的其他讨论根本毫无意义。
【关于“四”,多解释几句】
崔灿老师以平均AI吻合度这个指标为核心,辅以一定的数据基础和边界条件,构建了一个衡量不同棋手(含不同时代的棋手)水平高低的理论工具。
这个理论工具要想发挥作用,就必须证明,它在这样的数据、条件下,面对绝大多数的棋手,是“普遍适用”的。
崔灿老师在论文中,首先是承认了他的这个理论工具对李昌镐的适用上就有问题。
李昌镐在相当长时间内是当之无愧毫无争议的世界第一人。但是AI吻合度指标就是看着不高(大意如此)。
那么除了李昌镐的问题没有解决意外,我用崔灿老师的数据,分析常昊的例子,又从另一个角度提了反例,证明即使平均AI吻合度高于对手,常昊的成绩仍然是负多、胜少——说明在一定时间内,常昊的围棋水平还是不如对手。这就是这个理论工具的另一个反例。
这些都说明,这个理论工具,即使是在限定的数据基础上、边界条件下,也不具有“普遍适用性”。
连活着的棋手身上的数据都解释不通的理论工具,怎么可能用来解释不同历史时期的棋手的数据?
换句话说,这个理论工具如果不能解决活着的棋手的数据问题,就根本不能去随意推广到古人头上。
--
FROM 223.104.38.*