这标题攻击性太强。
没看过崔老师的文章,不直接谈论其内容。
个人观点,一向对使用AI吻合度之类指标,来评价人类棋力水平高低的做法不以为然。
原因有几个。最基本也最重要的一条是,AI自身就不是一个单调的线性标尺。
同样的棋招在不同AI,或同一AI不同版本之间,或同一AI同一版本的不同运行参数之间,评价差异都可以是天翻地覆的。而且这种差异经常不是同向变化的,也就是不能信任同样的运算状况可以作为比较基线使用。
不同局面对人类的困难度也是不一样的,开放性局面苦思出路,和打将被迫粘上的难度显然不同,两者贡献的吻合度如何区分呢?不要提复杂度,那是对AI的复杂度,不是对人的。
局面优劣也会影响吻合度。均势时达到高吻合度,比大优势或劣势时更难一些。劣势又比优势下更难一些。我没有亲测过,但猜想以下情况应该是存在的:在较高水平的人类让两子对局中,更容易出现下手的吻合度高于上手的情况。原因无它,当前基于AZ框架的AI行为就应当如此。
就像拿着把S形的尺子去量长度,每量一个对象前这尺子还会变一下姿势。结果当然不可能靠谱。
话说回来,AI吻合度有没有意义呢?那还是有的。它的含义就是“在这个条件下,这个局面中,你的这一招和我的招有这样那样的相同或不同。”而把它累加或引申开的任何做法,都有原理上的问题。
也就是听君一席话,如听一席话。这么想就行了。
【 在 computec (刀傍) 的大作中提到: 】
: 标 题: 崔灿古今分析非蠢即坏
: 发信站: 水木社区 (Tue Aug 31 18:59:39 2021), 转信
:
:
: 如果说他毫无逻辑的用误差极大吻合度指标判断古今各时代水平是蠢
:
: 那么他刻意选取数据达到自己想要的结论就是坏
: 1 古代 选最优秀棋手 和最优秀棋手下的被挑选过的质量最高的少量对局
: 简单评价: s少数最佳 a优秀 b高级普通 c普通普通
: 选手水平s 棋谱质量s (s挑选 和a未挑选跨度最大 至少相当于a-c的跨度)
:
: 2 现代职业 选世冠决赛 世冠决赛即使相对2016前最优秀棋手 平均也有100分以上的差距
: 棋谱范围是按比赛指定的而不是以质量高低为标准挑选的
: 选手水平a 棋谱质量a- (未挑选 接近本人巅峰期 用时比较充裕)
:
: 3 业余棋手 "1993年至2002年期间,如今网络上有据可查的“晚报杯”棋谱"
: 如果说02年以后四天王代表s
: 93-02top(孙宜国 刘钧) 02后强6 代表a
: 92-02晚报杯前10平均 只能算业余高手里的b级(野狐8+)
: 如果3小时每方能下出本人水平普通偏高质量(未挑选)
: 45分钟包干 只能给d或e(普通偏低,低)
: 选手水平b 棋谱质量d
:
: 拿古代ss 比现代职业aa- 比业余bd
: 完全是为了得到他想要的结论:
: 中国古代接近现代职业 >>业余
:
: 真tm不要脸!
:
: 如果可以这么挑的话 yh8的s棋谱 按吻合度评价 可以秒杀上面古代顶尖和职业一流
: 一个人可以蠢成这样么? 不可能
: 这tm还是收钱的研究项目?
: 骗傻子呢?
: 崔先生你真太不要脸了
:
:
: --
: 漠河 北极村 塔河 林海 十八站鄂伦春族乡 黑河 北安 齐齐哈尔 讷河 嫩江 九三 科洛 鄂伦春自治旗 加格达奇 大庆 哈尔滨 长春 沈阳 葫芦岛 秦皇岛 唐山 廊坊 北京
: 天津 沧州 石家庄 井陉 娘子关 阳泉 太原 长治 博爱(月山) 洛阳 西安 天水 兰州 武威 鄯善 吐鲁番 库尔勒 库车 阿克苏 巴楚 喀什 叶城 昆玉 和田 [终点]
: 郑州 开封 兰考 民权 商丘 郓城 阳谷 清河 德州 济南 潍坊 烟台 威海 胶州 日照 临沂 曲阜 泰安 徐州 淮安 连云 兴化 东台 南通 海门 扬州 镇江 南京 湖州 苏州 无锡
: 上海 嘉兴 杭州 绍兴 宁波 东阳 金华 义乌 永康 武义 合肥 铜陵 池州 青阳 九华 黄山 鹰潭 南昌 福州 福清 平潭 珠海 深圳 [南或北,东和西,霓虹还是荒漠..]
: 5244 An.湖南 消失的妖.孟买 Lynn.河北 Qw伟.河北 JLm南 骄阳似我.新加坡 Wxb+.香港 FQ10.1 [世界的尽头..]
:
:
: ※ 修改:·computec 于 Aug 31 19:16:40 2021 修改本文·[FROM: 223.104.38.*]
: ※ 来源:·水木社区 mysmth.net·[FROM: 223.104.38.*]
--
修改:computec FROM 223.104.38.*
FROM 114.253.37.*