平时我在论坛潜水比较多,鉴于易语言成功的让我赚到第一桶金,故开源4项稀罕代码,有不明白的可以回帖交流,
A.音频降噪(调用时代拓灵,实现语音降噪功能)
简介
1.音频降噪功能,可以消除音频中的环境音,杂音,交通工具等声音,效果很好,欢迎自行测试哈!
2.选择音频的时候,必须是16K文件,采样率16000,单声道WAV文件,其他格式可能不行,最后软件通过FFMPEG将pcm转WAV文件可以正常播放
B.音频切分(通过语气停顿进行精准切分)
简介
1.通过BASS,扫描音频中的波形,并实现说话停顿自动切分,方便一些字幕提取软件的开发
2.源码中默认按照最长20秒一段进行切分,你也可以自行更改,为了方便我已经做了备注
C.离线语音识别(调用第三方SDK实现,支持中英文识别)
简介
1.市面上windows,离线语音识别寥寥无几,易语言调用的SDK更是几乎为0
2.源码中注意事项已经整理成文档,请按照要求进行相应设置
3.离线语音识别采用CPU运算,对显卡没有要求
4.文件必须是16K文件,采样率16000,单声道WAV格式音频
5.每段音频不能超过60秒,刚好可以和上面的切分功能进行开发
6.电脑需要微软常用的Net库
D.离线语音合成(调用第三方SDK实现)
简介
1.网上很多离线语音合成的,通过系统自带的调用,效果就不说了
2.本源码支持9个发音人离线合成,支持语速、语调、不同心态合成
3.电脑需要安装JAVA,如果有了就不需要装了
链接: https://pan.baidu.com/s/1CH_zPgvlY_kATe8IXru2og 提取码: 3k7h