- 主题:很多首发起点中文网的盗版小说文字错版
这是怎么做到的?能防截图ocr吗
--
FROM 124.162.200.*
估计是,不知道会不会被账号持有者告
【 在 alanju 的大作中提到: 】
: 估计是加了账号识别机制,帮助识别盗版账号,
: 然后给盗版账号显示的文章做了人名,地名,反义词替换。
--
FROM 123.147.246.*
没明白你啥意思
【 在 jesce 的大作中提到: 】
: 感觉这比OCR容易多了. OCR需要考虑各种字体/大小/颜色/位置. 起点小说自己选个字体
: , 纯色背景, 做个2w个字的字库比对就行了. 了不起碰到识别度低于阈值的生僻字弹窗
: 再加入字库就行.
: ...................
--
FROM 123.147.246.*
这跟我问的问题有啥关系?
【 在 jesce 的大作中提到: 】
: OCR基于文字的边/角特征值, 还要考虑不同亮度脏污干扰扭曲变形, 难度是这种静态截
: 图的N倍. 不晓得盗版网站是怎么做的, 如果先针对起点的字体做一个detector模型, 然
: 后直接在字库中做逐字识别(直接全像素比对就行了), 应该不存在错别字.
: ...................
--
FROM 124.162.200.*