04｜如何评价音频质量的好与坏？

冯建元

你好，我是建元。
音频在采集、处理、压缩、传输、播放等过程中，不可避免的会对音频的质量产生影响。这节课我们就一起来看一下，音频质量是如何进行评价的。
你是否还记得，在之前我们讲音频编码封装的时候，讲过有损编码和无损编码。对于有损编码，有的人听上去几乎和无损一致，有的人却能听出差别。再比如降噪算法，降噪算法可能会对人声产生损伤、也可能有残余噪声影响听感。因此，评判一个降噪算法的好坏也需要一套综合的音频评价体系。
其实音频的评价方法主要有两种。一种是主观评价，即组织足够数量的人来听被测音频样本，并给每个被测样本打分，最后根据测试人打分的高低来评判音频质量的好坏。主观测试是音频评价的黄金准则，这样的评价是最符合人的实际听感的。但是主观评测费时费力，在算法迭代、研发等中间过程中不一定是最经济的方案。
另一种测试方法是客观测试，即通过数学方式计算出一些音频质量评价所需要的指标，比如信噪比（SNR）、频谱差异等。然后综合这些指标去拟合一个主观分数。这样就可以通过数学计算而不是人来给出一个音频质量的评价。
但无论是主观测试还是客观测试，都需要遵守一套严格的测试评价标准，来保证音频质量评价的准确性。那么下面我们先来看看主观评价有哪些可用的方法。

公开

同步至部落

取消

完成

0/2000

荧光笔

直线

曲线

笔记

复制

AI

深入了解
翻译
英语
中文简体
中文繁体
法语
德语
日语
韩语
俄语
西班牙语
阿拉伯语
解释
总结

音频质量评价方法及其应用音频质量对于音频采集、处理、压缩、传输和播放等环节至关重要。评价音频质量的方法主要分为主观评价和客观评价两种。主观评价通过组织足够数量的人来听取音频样本并打分，以此来评判音频质量的好坏。而客观评价则通过数学方式计算出一些音频质量评价所需要的指标，如信噪比、频谱差异等，来拟合一个主观分数。在客观评价方法中，有参考评价和无参考评价两种。有参考评价方法包括PESQ和POLQA，而无参考评价方法包括ITU-T P.563、ANIQUE+、E-model和ITU-T P.1201等。这些方法在不同场景下有各自的适用性和局限性。需要注意的是，无论是主观评价还是客观评价，都需要遵守一套严格的测试评价标准，来保证音频质量评价的准确性。客观测试目前只能测量音频的损伤程度，对于一些偏主观的测试类型，如音乐听感、耳机效果等，则一般还是需要依靠主观测试。针对分发式的主观测试，ITU-T P.808提供了详细的测试流程和方法。在实际应用中，对于在线通话App的实时通话质量打分，可以采用PESQ或者VisQol等客观评价方法。总的来说，音频质量评价方法丰富多样，各有适用场景和局限性。在实际应用中，需要根据具体情况选择合适的评价方法，以确保对音频质量的准确评估。

仅可试看部分内容，如需阅读全部内容，请付费购买文章所属专栏
《搞定音频技术》，新⼈⾸单¥59

立即购买

登录后留言

全部留言(9)

最新
精选

晓龙
可以用主观法： 1. 通话时，分别在发送端和接收端做录音，然后对比。 2. 语音延迟，可以用双端报数的方式主观测试。无参考客观法，可以通过查看音频丢包率，网络延时等评测
作者回复: 嗯是的，稍微补充一下后续的课程里可能会发现，降噪和回声消除也会对主观分数产生影响。
2021-11-30

2
springXu
在线实时通信的音频测试，我认为用客观无参考测试的方案中去选。原因是网络好坏也会改变通话质量，这个参考音频是没有的。但对于知道了音频的帧率和编码解码时，有了参考样本，可选的测试范围就多了。
作者回复: 回答得挺对
2021-11-29

2
我有一条鱼
针对ANIQUE+、+ ITU-T P.1201这些检测方法，目前有一些实现比较好的开源项目实现吗？
作者回复: 这些测试一般在ACQUA等实验设备中有集成，据我所知还没有直接可用的开源项目
2022-03-02

1
徐刚
客观评价无参考方法；能够实时反馈通话质量；可以结合ANIQUE+ + ITU-T P.1201；实时网络通话，包含前段处理和网络传输，这2者结合，能够覆盖整个通话链路，反应最终通信双方实际的听觉感受
作者回复: 正确
2021-11-29

1
Dom
从问题的描述上面来看（在线通话 App 做实时通话质量打分），重点在于【在线通话】和【实时】，所以没有办法使用主观的方法和带参考信号的客观方法，只能从无参考信号的客观方法里面去做选择，比如其他回答里面提到的ANIQUE+ + ITU-T P.1201。这个里面还有一些工程问题： 1.需要针对网络丢包的情况做客观统计，用于衡量网络对语音质量的影响； 2.需要针对高评分和低评分的语音段保存，通过人工的方式进行抽查，用于评估【客观评估】的准确性； 3.评分样本的保存，用于后续的训练和排查问题； 4.除此之外，还需要找到影响语音质量的其他因素，我们上面只是提到了语音本身和网络这两个因素，可能还存在其他因素对语音质量进行干扰，需要做一个工程上面的排查
作者回复: 思路不错，现有的无参考的评价其实是对整体语音信号质量评估。比较难以找到根因。为了找到根因需要每个环节都对结果进行一次评测，看看是哪个环节影响了质量。
2022-01-12


写点啥呢
请教老师，无参考客观评价方法，其评价算法的设计思路和指标设计是什么样子的，比如它考虑哪些指标来给出评价呢？
作者回复: 这个不同算法可能不太一样。举个例子，每个中间模块的状态。比如网络延迟、抖动，codec自身的MOS、以及一些音频前处理中的信噪比例、信回比例之类的指标来综合评价。
2021-11-29


言C
老师，请问下目前有什么可以直接用来对音频评分的软件吗？
2022-09-06归属地：湖南


龚长华
基于实时和网络性，可选择无参考的客观评价法。如果双端录音后，可采用主观评价法。
2022-04-19


Geek_7de4c5
P.563和P.1201同时打分，再算均分比较合适
2021-11-29



收起评论