- 主题:现在语音识别还这么金贵?
通过语音识别实时输出文本的功能,讯飞的软件还是按时间计费,还限制导出文本。
别的公司的产品在水平上还那么不堪吗?
想着本世纪初,当时输入法不好用,懒得敲字,就用IBM的vocicexxx撸毕设论文来着。
想要一个这样的功能,通过语音识别实时输出文本,最后能导出文本。
或者进一步的,直接读取音视频文件,可以很快的生成一个文本出来。讯飞有这样的产品吗?
想着很简单:用开源库的话,不需要比得上讯飞,稍微差点也可以,自己撸一个出来可以堪用?
--
修改:zhanghaoX FROM 121.69.79.*
FROM 121.69.79.*
是的,如果你可以随随便便撸一个出来,是可以直接拿去创业的
--
FROM 121.69.130.162
视频文件?
给你个电影 自动识别声音 输出台词文本
让字幕组失业
【 在 zhanghaoX 的大作中提到: 】
: 通过语音识别实时输出文本的功能,讯飞的软件还是按时间计费,还限制导出文本。
: 别的公司的产品在水平上还那么不堪吗?
: 想着本世纪初,当时输入法不好用,懒得敲字,就用IBM的vocicexxx撸毕设论文来着。
: ...................
--
FROM 61.237.228.*
那是翻译好不好,这个是相当于速记
【 在 qys303 的大作中提到: 】
: 视频文件?
: 给你个电影 自动识别声音 输出台词文本
: 让字幕组失业
: ...................
--
FROM 114.242.250.*
当然是输出英文文本
【 在 zhanghaoX 的大作中提到: 】
: 那是翻译好不好,这个是相当于速记
--
FROM 61.237.228.*
油管的字幕难道不是机器生成?
【 在 qys303 的大作中提到: 】
: 当然是输出英文文本
:
: 【 在 zhanghaoX 的大作中提到: 】
: ...................
--
FROM 114.242.250.*
是要用在什么场景呢?
【 在 zhanghaoX (环顾四方有效) 的大作中提到: 】
:
:
: 通过语音识别实时输出文本的功能,讯飞的软件还是按时间计费,还限制导出文本。
: ...................
--
FROM 36.157.217.*
就比如,录音采访, 电视字幕 ,讲课文本
【 在 forevers 的大作中提到: 】
: 是要用在什么场景呢?
:
--
FROM 221.218.141.*
云端识别时代已经没那么金贵了,但是语音的应用一直没找到像图像识别那么好的盈利方案,所以讯飞不再仅仅做语音了,而且讯飞盈利模式一直是遭质疑的
【 在 zhanghaoX 的大作中提到: 】
: 通过语音识别实时输出文本的功能,讯飞的软件还是按时间计费,还限制导出文本。
: 别的公司的产品在水平上还那么不堪吗?
: 想着本世纪初,当时输入法不好用,懒得敲字,就用IBM的vocicexxx撸毕设论文来着。
: ...................
--
FROM 223.64.97.*
你头脑混乱啊
电影里的一段采访
和你自己去找路人问话,
有啥差别吗?
你自动生成相关字幕
【 在 zhanghaoX 的大作中提到: 】
: 油管的字幕难道不是机器生成?
--
FROM 61.237.228.*