05｜音频降噪如何对症下药？

冯建元

你好，我是建元。今天我们来聊聊噪声的分类与常见的降噪方法。
听到噪声，很多人可能首先想到的是深夜的广场舞曲、呼啸的东北风、车水马龙的呼啸而过。但其实噪声是一个相对的概念。如果你想听的目标只有人们说话的声音，那么所有其它的声音包括音乐、 风声等其就都是噪声，而如果你想听鸟语虫鸣，那人声对你来说也是噪声。
在这里我们主要聊的是当保留目标是人声时，噪声会有哪些分类，它们有什么特点，以及我们如何更好地保留人声去除噪声。这也是音视频工程师的主要工作场景。
噪声的分类从通信系统的角度来说，噪声可以分为加性噪声和乘性噪声。
加性噪声与信号之间满足加性条件，即加噪信号是由噪声和源信号相加得到的，这种情况下信号和噪声是不相关的，我们常见的自然噪声、人造的噪声如电子元器件发出的热噪声等都是这种。
乘性噪声则是，噪声和信号是相关联的，比如信号的衰减、房间的混响、多普勒效应等。这类噪声往往是以信号乘积的形式出现，而且往往是从信道传输中产生，所以也叫信道噪声。我们这里主要讲的是人声与其它不相关的噪声的处理，所以主要是针对加性噪声来讲。
加性噪声的种类如果按照声源，比如风声、汽笛声、键盘敲击声等，种类则成千上万，但从降噪方法的选择角度上来说，我们可以按照噪声是否平稳，把噪声分为两类：稳态噪声和非稳态噪声。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
中文繁体
法语
德语
日语
韩语
俄语
西班牙语
阿拉伯语
解释
总结

本文介绍了音频降噪的基本概念和常见方法，包括线性滤波器、谱减法以及基于统计模型和机器学习的降噪算法。文章详细介绍了基于统计模型的实时降噪算法的原理和流程，以及其中涉及的分位数噪声估计和维纳滤波等方法。此外，文章还提到了改进方法OMLSA&IMCRA算法，对比了该算法与WebRTC原生降噪的效果。通过本文的阅读，读者可以深入了解音频降噪的原理和应用，以及不同降噪算法的特点和适用场景。文章还介绍了子空间算法和基于机器学习的降噪方法，强调了根据不同噪声类型选择合适的降噪算法的重要性。最后，提出了思考题，引导读者思考在不同实时互动应用中的噪声类型及可能采用的降噪算法。整体而言，本文内容丰富，涵盖了多种降噪算法及其适用范围，对读者了解音频降噪具有一定的指导意义。

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《搞定音频技术》，新⼈⾸单¥59

立即购买

登录后留言

全部留言(9)

最新
精选

Geek_064e72
能给出实现代码或者开源代码就更好了，估计没几个人能够手写出那个webrtc降噪的改进算法吧？
作者回复: webrtc的代码是开源的而且有专利作为文档还是比较好入手的一个方向、如果还觉得复杂还可以在github上找找Matlab或者python版本的算法来跑通练手
2022-02-07


功夫熊猫
老师，自适应滤波器怎么样？我目前刚学了数字信号处理，这次和我的老师合作了一个拿FPGA实现一个自适应滤波器，用的是LMS算法。我也看了维娜和卡尔曼滤波，主要是资料上说这两种算法不太容易实现就没做了，最后看说LMS算是比较简单的。
作者回复: 自适应滤波可以说是一个基础简单好用，稍微说一下Kalman filter，这种算法最早是Kalman推荐给NASA做航空轨道计算的所以它的目标跟踪能力比较强也就是说自适应收敛的速度比较快。FPGA上其实都是可以实现的。
2021-12-21


坚坚
"我们这里用到的是实时频域维纳滤波器，目标就是求出当前帧每个频点的能量有多少占比是语音，即语音的先验信噪比（SNR）。我们把当前帧的含噪信号与噪声的信噪比叫做后验信噪比，而纯净语音信号与噪声的信噪比叫先验信噪比。因为在实时处理时没有纯净的参考信号，所以先验信噪比通常为后验信噪比结合判决引导的方法来估算." 被这段话绕晕了，我的理解是一般是先确定先验概率，再估算后验概率，为啥这里结论是“先验信噪比通常为后验信噪比结合判决引导的方法来估算”？
作者回复: 哈哈，确实这里有点绕。其实维纳滤波降噪的目标是求一个”先验”也就是过往经验得出的当前帧中语音比例。注意这里说的是先验和后验信噪比和概率论中的先验概率和后验概率是不太一样的。在降噪里我们永远不知道原始不含噪的语音是什么（所以不存在什么后验概率），所以只能依靠后验的含噪信号与噪声的信噪比来估计前验的语音与含噪信号的比值。
2021-12-06


Geek_7de4c5
微信通话有严重的混响。并且有吃音现象。老师请问一下，对于键盘声这种瞬态噪声，webrtc原生降噪算法是否可以增加内置模板解决呢？
作者回复: 其实是可以的，WebRTC中是一个对稳态噪声的降噪，可以再接一个对瞬态噪声识别加处理后处理模块。或者先识别然后修改原生降噪模块的频谱mask的结果。再或者直接用AI降噪替代。
2021-12-01


springXu
微信或者远程会议的电话里的噪音，我认为是非稳态噪音。原因稳态噪音已经被降噪了，像风的声音又或者笔记本风扇的噪音。其他实时互动如qq视频聊天，我在一年前使用时，键盘的按键声是可以没有被过滤的。
作者回复: 感知正确。
2021-12-01


Geek6831
老师您好，关于非负矩阵分解方法想进一步理解，请问可以推荐一些资料么？
2023-02-17归属地：北京


是鸭鸭呀
如何判断出播放中的噪音。比方说用户说我们和竞品相比音质差，可以通过什么软件去客观判断音质差这个问题？
2022-06-30


四十
发行歌曲中的音乐是不是也是加在谐波上的
2022-04-25


龚长华
远程会议中，噪声是连续非稳态噪声。
2022-04-19



收起评论