水木社区手机版
首页
|版面-编程技术(Programming)|
新版wap站已上线
展开
|
楼主
|
同主题展开
|
返回
上一篇
|
下一篇
主题:问个汉字处理的问题
iwannabe
|
2025-12-04 10:15:00
|
有个文件,包含'97' 11997 和食是相同的字,但是是不同的编码,
97 (U+2EDD)和 食 (U+98DF)的关系是:它们是同一个字的不同视觉表现形式,但
Unicode 指定 U+98DF 为标准形式,U+2EDD 为其异体形式(特别是作为部首时)。
问了一下 AI ,都是让枚举做一个 map ,有没有统一的转化这样汉字的方案,
unicodedata.normalize 不行。
--
FROM 111.55.204.*
上一篇
|
下一篇
选择讨论区
首页
|
分区
|
热推
BYR-Team
©
2010.
KBS Dev-Team
©
2011
登录完整版