水木社区手机版
首页
|版面-计算机图形图像学(Graphics)|
新版wap站已上线
返回
1/1
|
转到
主题:[讨论]手持笔在普通书本上选区
楼主
|
yzsn10000
|
2021-05-07 08:49:00
|
展开
有一个突发奇想,请版友们看看能不能实现
可不可以在阅读的过程中,通过一支
特制的笔
对感兴趣的文字进行选区(在文字间
画一个闭合的框
),从而提取出该区域的文字,整理成一个读书笔记呢?
为了方便理解我的意思,可以将图片中的普通笔设想成一支特制的笔。
--
FROM 101.6.57.*
2楼
|
yzsn10000
|
2021-05-08 16:16:18
|
展开
小朋友的点读笔是点专门的书籍,书籍上印刷有隐码。
我想做的这支笔是抄录普通书,具有图像区域自动选取、ocr等功能。
【 在 eojessie 的大作中提到: 】
: 好像小朋友的点读笔
--
FROM 101.6.57.*
7楼
|
yzsn10000
|
2021-08-12 16:31:57
|
展开
感谢您参与讨论。
我也考虑过词典笔的技术方案,我看网易有道的词典笔需要逐字逐句的扫描。
我的这个想法的应用对象是上了年纪的老人,看书费眼,可以将看转变为听。有了这支笔,看什么就大概选择一下就可以。
我的初步设想是,这支笔具有一个广角镜头和一个微距镜头,广角镜头大概在靠近笔腰的位置,微距镜头大概在靠近笔尖的位置,广角镜头摄入视野内的文字段落,微距镜头摄入笔尖范围的个别词句,通过算法,实现阅读区域的识别,通过ocr、tts技术,将所选范围的文字转变成语音。欢迎大家继续讨论~
【 在 Bernstein 的大作中提到: 】
: 去找网易、汉王、讯飞,这些都有词典笔,有扫描读取功能
: 不知道现在有没有这个功能,估计加上去也很简单
:
--
FROM 221.223.83.*
8楼
|
yzsn10000
|
2021-08-12 16:34:53
|
展开
感谢您参与讨论。
拍照后转成文字,这个技术有成熟方案,是这支笔的技术基础。
我的这个想法的应用对象是上了年纪的老人,看书费眼,可以将看转变为听。有了这支笔,看什么就大概选择一下就可以。
我的初步设想是,这支笔具有一个广角镜头和一个微距镜头,广角镜头大概在靠近笔腰的位置,微距镜头大概在靠近笔尖的位置,广角镜头摄入视野内的文字段落,微距镜头摄入笔尖范围的个别词句,通过算法,实现阅读区域的识别,通过ocr、tts技术,将所选范围的文字转变成语音。欢迎大家继续讨论~
【 在 Fsh520 的大作中提到: 】
: 印象笔记会员拍照识别成文字。
:
--
FROM 221.223.83.*
9楼
|
yzsn10000
|
2021-08-12 16:37:45
|
展开
感谢您参与讨论。
您的想法是个好主意,比较容易实施,可以利用现有点读笔的技术。
【 在 goddkiller 的大作中提到: 】
: 我觉得可以走技术难度低点的路子
: 对大量的书先做好电子书,然后只用识别书的页码和笔画框的位置...再从电子版里提取出对应内容生成笔记
--
FROM 221.223.83.*
11楼
|
yzsn10000
|
2021-08-12 16:42:13
|
展开
感谢您参与讨论。
您提的这个确实可以解决我上面提到的问题。在讨论题目中,应用场景没有说清楚。
我的这个想法的应用对象是上了年纪的老人,看书费眼,可以将看转变为听。有了这支笔,看什么就大概选择一下就可以。
我的初步设想是,这支笔具有一个广角镜头和一个微距镜头,广角镜头大概在靠近笔腰的位置,微距镜头大概在靠近笔尖的位置,广角镜头摄入视野内的文字段落,微距镜头摄入笔尖范围的个别词句,通过算法,实现阅读区域的识别,通过ocr、tts技术,将所选范围的文字转变成语音。欢迎大家继续讨论~
【 在 solrex 的大作中提到: 】
: 百度APP的拍照翻译就可以
: 发自「今日水木 on iPhone XR」
--
FROM 221.223.83.*
1/1
|
转到
选择讨论区
首页
|
分区
|
热推
BYR-Team
©
2010.
KBS Dev-Team
©
2011
登录完整版