- 主题:Re:请问以下字符串查找功能怎么实现
你把所有这样的字先列出来(可以先去新华字典里找所有“王”字偏旁的字),放到一个list/数组中。
然后用“贾”加上这个list/数组中的每个字去遍历《红楼梦》的文本,匹配成功则打印出来。
【 在 Haimdinger 的大作中提到: 】
: 比如红楼梦贾宝玉,贾琏,贾珍都是“贾”字里面带一个有王字部首的。那么怎么样才能列出书中所有贾字加带有王字部首的名字呢?是不是第二个字只能图形匹配了?
: 发自「快看水母 于 2211133C」
: ※ 修改:·Haimdinger 于 Nov 11 23:08:31 2023 修改本文·[FROM: 219.141.69.*]
: ...................
--
修改:Haimdinger FROM 219.141.69.*
FROM 221.216.197.*
你找一个按偏旁部首排列的汉字字典表就行。
或者你找一个形码(五笔、郑码)的单字码表,都是按部首排列的。
换字的时候,去码表中截取一段就行。
这是郑码码表中以“王”作为部首的单字(只是一部分)
c 现
ca 王
cad 玗
caed 玕
cag 奏
cahi 珷
cai 玎
caj 珂
cakk 瑨
caua 玶
cawr 瓇
caxk 璢
cays 珁
caza 玙
cb 奉
cbb 珪
cbdu 瓙
cbi 玒
cbjd 璹
cbll 瓄
cbm 琽
cbod 玞
cbol 瓉
cbr 玩
cbrd 玩
cbrr 珯
cbxj 珸
...
【 在 Haimdinger 的大作中提到: 】
: 好吧,是个思路,但是好像人工工作太多了,换一个字又要调。
: 发自「快看水母 于 2211133C」
--
修改:seablue FROM 221.216.197.*
FROM 221.216.197.*
或者用更暴力的方法,就是直接用正则“贾.{1,2}”去搜《红楼梦》的文本,这样所有以“贾”开头的双字或三字都会被搜出来。
排序、去重之后,再一个个去看第二个字(或第三个字)是不是满足以“王”字作为偏旁。把“贾府、贾家”这样的去掉。
【 在 seablue 的大作中提到: 】
: 你找一个按偏旁部首排列的汉字字典表就行。
: 或者你找一个形码(五笔、郑码)的单字码表,都是按部首排列的。
: 换字的时候,去码表中截取一段就行。
: ...................
--
修改:seablue FROM 221.216.197.*
FROM 221.216.197.*