或者用更暴力的方法,就是直接用正则“贾.{1,2}”去搜《红楼梦》的文本,这样所有以“贾”开头的双字或三字都会被搜出来。
排序、去重之后,再一个个去看第二个字(或第三个字)是不是满足以“王”字作为偏旁。把“贾府、贾家”这样的去掉。
【 在 seablue 的大作中提到: 】
: 你找一个按偏旁部首排列的汉字字典表就行。
: 或者你找一个形码(五笔、郑码)的单字码表,都是按部首排列的。
: 换字的时候,去码表中截取一段就行。
: ...................
--
修改:seablue FROM 221.216.197.*
FROM 221.216.197.*