易语言资源网 - 做最全的易语言资源下载社区
精易论坛授权登录

【音频处理】音频降噪/切分/离线语音识别/离线TTS   [复制链接]

    2021-11-26 19:23:00
    2021开源大赛(第六届)
    易语言资源网
    6334 次浏览
    来源链接

平时我在论坛潜水比较多,鉴于易语言成功的让我赚到第一桶金,故开源4项稀罕代码,有不明白的可以回帖交流,


A.音频降噪(调用时代拓灵,实现语音降噪功能)

 

简介

1.音频降噪功能,可以消除音频中的环境音,杂音,交通工具等声音,效果很好,欢迎自行测试哈!

2.选择音频的时候,必须是16K文件,采样率16000,单声道WAV文件,其他格式可能不行,最后软件通过FFMPEG将pcm转WAV文件可以正常播放

B.音频切分(通过语气停顿进行精准切分)


简介

1.通过BASS,扫描音频中的波形,并实现说话停顿自动切分,方便一些字幕提取软件的开发

2.源码中默认按照最长20秒一段进行切分,你也可以自行更改,为了方便我已经做了备注


C.离线语音识别(调用第三方SDK实现,支持中英文识别)

简介

1.市面上windows,离线语音识别寥寥无几,易语言调用的SDK更是几乎为0

2.源码中注意事项已经整理成文档,请按照要求进行相应设置

3.离线语音识别采用CPU运算,对显卡没有要求

4.文件必须是16K文件,采样率16000,单声道WAV格式音频

5.每段音频不能超过60秒,刚好可以和上面的切分功能进行开发

6.电脑需要微软常用的Net库


D.离线语音合成(调用第三方SDK实现)

简介

1.网上很多离线语音合成的,通过系统自带的调用,效果就不说了

2.本源码支持9个发音人离线合成,支持语速、语调、不同心态合成

3.电脑需要安装JAVA,如果有了就不需要装了



链接: https://pan.baidu.com/s/1CH_zPgvlY_kATe8IXru2og 提取码: 3k7h 



[错误报告]   上一篇:超强表格fpspr模块完整开源...     下一篇:算法生成手机信息...