水木社区手机版
首页
|版面-网络小说(NetNovel)|
新版wap站已上线
返回
1/1
|
转到
主题:很多首发起点中文网的盗版小说文字错版
8楼
|
jesce
|
2022-11-17 11:29:30
|
展开
感觉这比OCR容易多了. OCR需要考虑各种字体/大小/颜色/位置. 起点小说自己选个字体
, 纯色背景, 做个2w个字的字库比对就行了. 了不起碰到识别度低于阈值的生僻字弹窗
再加入字库就行.
【 在 hhss 的大作中提到: 】
: 这是怎么做到的?能防截图ocr吗
--
FROM 113.116.28.*
11楼
|
jesce
|
2022-11-17 17:37:02
|
展开
OCR基于文字的边/角特征值, 还要考虑不同亮度脏污干扰扭曲变形, 难度是这种静态截
图的N倍. 不晓得盗版网站是怎么做的, 如果先针对起点的字体做一个detector模型, 然
后直接在字库中做逐字识别(直接全像素比对就行了), 应该不存在错别字.
【 在 hhss 的大作中提到: 】
: 没明白你啥意思
--
FROM 113.116.28.*
1/1
|
转到
选择讨论区
首页
|
分区
|
热推
BYR-Team
©
2010.
KBS Dev-Team
©
2011
登录完整版