搞定音频技术
冯建元
声网 Agora 音频算法专家
5340 人已学习
新⼈⾸单¥59
登录后,你可以任选3讲全文学习
课程目录
已完结/共 19 讲
搞定音频技术
15
15
1.0x
00:00/00:00
登录|注册

04|如何评价音频质量的好与坏?

你好,我是建元。
音频在采集、处理、压缩、传输、播放等过程中,不可避免的会对音频的质量产生影响。这节课我们就一起来看一下,音频质量是如何进行评价的。
你是否还记得,在之前我们讲音频编码封装的时候,讲过有损编码和无损编码。对于有损编码,有的人听上去几乎和无损一致,有的人却能听出差别。再比如降噪算法,降噪算法可能会对人声产生损伤、也可能有残余噪声影响听感。因此,评判一个降噪算法的好坏也需要一套综合的音频评价体系。
其实音频的评价方法主要有两种。一种是主观评价,即组织足够数量的人来听被测音频样本,并给每个被测样本打分,最后根据测试人打分的高低来评判音频质量的好坏。主观测试是音频评价的黄金准则,这样的评价是最符合人的实际听感的。但是主观评测费时费力,在算法迭代、研发等中间过程中不一定是最经济的方案。
另一种测试方法是客观测试,即通过数学方式计算出一些音频质量评价所需要的指标,比如信噪比(SNR)、频谱差异等。然后综合这些指标去拟合一个主观分数。这样就可以通过数学计算而不是人来给出一个音频质量的评价。
但无论是主观测试还是客观测试,都需要遵守一套严格的测试评价标准,来保证音频质量评价的准确性。那么下面我们先来看看主观评价有哪些可用的方法。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

音频质量评价方法及其应用 音频质量对于音频采集、处理、压缩、传输和播放等环节至关重要。评价音频质量的方法主要分为主观评价和客观评价两种。主观评价通过组织足够数量的人来听取音频样本并打分,以此来评判音频质量的好坏。而客观评价则通过数学方式计算出一些音频质量评价所需要的指标,如信噪比、频谱差异等,来拟合一个主观分数。在客观评价方法中,有参考评价和无参考评价两种。有参考评价方法包括PESQ和POLQA,而无参考评价方法包括ITU-T P.563、ANIQUE+、E-model和ITU-T P.1201等。这些方法在不同场景下有各自的适用性和局限性。需要注意的是,无论是主观评价还是客观评价,都需要遵守一套严格的测试评价标准,来保证音频质量评价的准确性。 客观测试目前只能测量音频的损伤程度,对于一些偏主观的测试类型,如音乐听感、耳机效果等,则一般还是需要依靠主观测试。针对分发式的主观测试,ITU-T P.808提供了详细的测试流程和方法。在实际应用中,对于在线通话App的实时通话质量打分,可以采用PESQ或者VisQol等客观评价方法。 总的来说,音频质量评价方法丰富多样,各有适用场景和局限性。在实际应用中,需要根据具体情况选择合适的评价方法,以确保对音频质量的准确评估。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《搞定音频技术》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(9)

  • 最新
  • 精选
  • 晓龙
    可以用主观法: 1. 通话时,分别在发送端和接收端做录音,然后对比。 2. 语音延迟,可以用双端报数的方式主观测试。 无参考客观法,可以通过查看音频丢包率,网络延时等评测

    作者回复: 嗯是的,稍微补充一下后续的课程里可能会发现,降噪和回声消除也会对主观分数产生影响。

    2021-11-30
    2
  • springXu
    在线实时通信的音频测试,我认为用客观无参考测试的方案中去选。原因是网络好坏也会改变通话质量,这个参考音频是没有的。 但对于知道了音频的帧率和编码解码时,有了参考样本,可选的测试范围就多了。

    作者回复: 回答得挺对

    2021-11-29
    2
  • 我有一条鱼
    针对ANIQUE+、+ ITU-T P.1201这些检测方法,目前有一些实现比较好的开源项目实现吗?

    作者回复: 这些测试一般在ACQUA等实验设备中有集成,据我所知还没有直接可用的开源项目

    2022-03-02
    1
  • 徐刚
    客观评价无参考方法;能够实时反馈通话质量;可以结合ANIQUE+ + ITU-T P.1201;实时网络通话,包含前段处理和网络传输,这2者结合,能够覆盖整个通话链路,反应最终通信双方实际的听觉感受

    作者回复: 正确

    2021-11-29
    1
  • Dom
    从问题的描述上面来看(在线通话 App 做实时通话质量打分),重点在于【在线通话】和【实时】,所以没有办法使用主观的方法和带参考信号的客观方法,只能从无参考信号的客观方法里面去做选择,比如其他回答里面提到的ANIQUE+ + ITU-T P.1201。 这个里面还有一些工程问题: 1.需要针对网络丢包的情况做客观统计,用于衡量网络对语音质量的影响; 2.需要针对高评分和低评分的语音段保存,通过人工的方式进行抽查,用于评估【客观评估】的准确性; 3.评分样本的保存,用于后续的训练和排查问题; 4.除此之外,还需要找到影响语音质量的其他因素,我们上面只是提到了语音本身和网络这两个因素,可能还存在其他因素对语音质量进行干扰,需要做一个工程上面的排查

    作者回复: 思路不错,现有的无参考的评价其实是对整体语音信号质量评估。比较难以找到根因。为了找到根因需要每个环节都对结果进行一次评测,看看是哪个环节影响了质量。

    2022-01-12
  • 写点啥呢
    请教老师,无参考客观评价方法,其评价算法的设计思路和指标设计是什么样子的,比如它考虑哪些指标来给出评价呢?

    作者回复: 这个不同算法可能不太一样。举个例子,每个中间模块的状态。比如网络延迟、抖动,codec自身的MOS、以及一些音频前处理中的信噪比例、信回比例之类的指标来综合评价。

    2021-11-29
  • 言C
    老师,请问下目前有什么可以直接用来对音频评分的软件吗?
    2022-09-06归属地:湖南
  • 龚长华
    基于实时和网络性,可选择无参考的客观评价法。 如果双端录音后,可采用主观评价法。
    2022-04-19
  • Geek_7de4c5
    P.563和P.1201同时打分,再算均分比较合适
    2021-11-29
收起评论
显示
设置
留言
9
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部