人生的意义就是思考其意义分享 http://blog.sciencenet.cn/u/qianlivan 天体物理工作者,家乡云南昆明。

博文

听写与语音识别(一)

已有 3208 次阅读 2016-2-12 12:07 |个人分类:知识|系统分类:科研笔记|关键词:学者| 语音识别软件

昨夜和几个同事翻译视频,难度比我想象的大很多。因为是自己录直播视频,然后马上开始翻译,故而没有英文字幕。可以想象,难度马上从翻译变为了听写。原则上听写不是不可完成的任务,但是缺乏准备,所以手头没有好用的工具,就拿着鼠标来回拖动视频。花了半个小时只听写了两分钟的视频。最后没有完成预定工作量,只能做了缩减。

早上起来,搜索了一下有没有什么用于听写的工具,搜到一个,看着不错。地址在

http://otranscribe.com/

这是一个基于网页的工具(基于HTML5,据说因此文件不用上传),有些方便的快捷键,可以倒回几秒、快放、慢放、加时间戳。昨夜要是有这个工具,应该能多听写一些。

后来忽然想到,有没有什么软件能把声音转换为文字?这就是语音识别问题,这样的软件应该是有的。搜了一下,感觉靠谱的只有两种,一种就是Window XP自带的语音识别,另外一种就是IBM开发的语音识别系统。按照说明,后者每分钟可以输入150个汉字。准备尝试一下。




https://m.sciencenet.cn/blog-117333-955738.html

上一篇:思考题(三十八)通信为什么用窄带信号?
下一篇:会议文集《Frontiers in Radio Astronomy 2015》勘误表

0

该博文允许实名用户评论 评论 (0 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-2 19:57

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部