科学网

 找回密码
  注册
新一代高保真声码器ItoWave (已被ICASSP 2022录用)
石自强 2022-2-23 14:42
声码器是语音合成的主要组件。 它将音频的中间形式(称为声学特征,例如梅尔频谱)转换为可听的声音波形。 最近 Shoule Wu 和我合作发明了一种新一代的高保真声码器 ItoWave 。 ItoWave 基于伊藤随机微分方程开发。我们提出通过线性 Ito 随机微分方程,在条件输入下, 如原始声音特征(例如语音 ...
个人分类: 科研DEMO|1463 次阅读|没有评论
TasTas在Interspeech2020国际学术会议发表
热度 1 石自强 2020-10-29 11:34
2020年10月25日-29日参加了在中国上海举行的国际语音通讯联合会年度会议(Annual Conference of The International Speech Communication Association, Interspeech2020)。Interspeech是语音处理领域最权威的国际会议,每年召开一次。世界各国著名高校、研究机构及相关知名企业等均参会。我们的论文题为“Speech Separati ...
个人分类: 科研DEMO|3014 次阅读|2 个评论 热度 1
Learning-to-learn项目总结
石自强 2019-5-2 23:20
过去的一年,我主要领导和参与了两个项目,分别是语音分离和learning-to-learn。其中语音分离还是原来的老本行声音技术下面的一个小领域,在其他博文已经做了介绍。本篇文章的目的主要是总结一下learning-to-learn项目的经验,以便吃一堑长一智。 &nb ...
个人分类: 科研DEMO|3344 次阅读|没有评论
语音识别常用的Linux编程知识点
石自强 2016-7-5 13:34
由于 htk 和 kaldi 的流行, linux 环境更适合语音识别的研究和开发。在 linux 下,为了进行语音识别的实验,经常要使用很多 shell 、 python 以及 perl 语言的脚本程序 ,在这儿总结一下最常用的一些知识点的用法,以备不时之需。
个人分类: 科研DEMO|3568 次阅读|没有评论
婴儿哭声监测软件 LilyBabyCryingDetector v1.0
热度 2 石自强 2015-12-13 15:51
我们开发了一款能够自动监测婴儿哭声的软件 LilyBabyCryingDetectorv1.0 ,当软件监测到婴儿哭声时,会自动报警,提醒父母和家人。它能够帮助父母快速去哄正在哭泣的婴儿,满足他们的需要。首先给出这款软件的试用下载地址: http://pan.baidu.com/s/1qXykS4O LilyBabyCryingDetectorv1.0 这款软件是基于我们之前开 ...
个人分类: 科研DEMO|16425 次阅读|2 个评论 热度 2
数值优化软件libopt v1
石自强 2015-11-9 13:44
在做优化的过程中,经常用到一些矩阵操作以及优化算法的程序,整理成了一个可用的优化工具软件 libopt v1 ,总结在这里。 首先给出软件的下载链接: http://pan.baidu.com/s/1jG51tmI 或者直接下载 libopt-demo.rar libopt 可以完成所有的矩阵操作,包括加法,减法,数乘,转置,共轭,共轭转 ...
个人分类: 科研DEMO|4432 次阅读|没有评论
声纹识别、说话人识别软件,SPEAKER v0.1
热度 1 石自强 2015-1-12 23:01
2016.01.27更新 我们的声纹识别技术在2015年8月贵阳召开的CTF2015(China technology forum 2015)会议上展示,获得好评。 http://www.fujitsu-jftt.com/listItemSelect.action?infoId=94 我们的声纹识别技术在2015年9月被富士通对全球做新闻发表,以下分别是中英文链接和截图:   ...
个人分类: 科研DEMO|10231 次阅读|1 个评论 热度 1
语音基频提取软件、音乐旋律提取软件,LillyMELODY V1.0
热度 1 石自强 2014-7-24 17:03
我们设计并实现了一种用于实时检测语音基频( pitch )、提取音乐旋律( melody )的软件。首先给出软件的下载链接: DEMO.zip 语音或者音乐的基频是一种很重要的特征,可以用在很多研究与应用中。比如:用于普通话语音声调的识别和确认;语音流利度的分析;音乐旋律的提取用于哼唱检索等。读者可以参 ...
个人分类: 科研DEMO|6729 次阅读|1 个评论 热度 1
活动语音检测软件,LillyVAD V1.0
热度 1 石自强 2014-7-23 11:22
我们设计并实现了一种用于实时检测活动语音的软件。首先给出软件的下载链接: DEMO.zip 活动语音检测 (Voice activity detection , VAD), 也称为 speech activity detection or speechdetection 或者 语音端点检测 , 是一项用于 语音处理 的技术,目的是检测语音信号是否存在。 VAD 技术主 ...
个人分类: 科研DEMO|5308 次阅读|2 个评论 热度 1
基于DropConnect正则化的深度神经网络 之 实验重现
热度 2 石自强 2014-5-17 09:37
最近万力在论文“Regularization of Neural Network using DropConnect”中提出了一种预防深度神经网络过拟合的方法——DropConnect。他们在很多数据集上取得了最好的结果。不过正如Zygmunt在其文章“ http://fastml.com/regularizing-neural-networks-with-dropout-and-with-dropconnect/ ”中提到的,Drop ...
个人分类: 科研DEMO|6167 次阅读|3 个评论 热度 2

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-13 08:59

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部