搞定音频技术
冯建元
声网 Agora 音频算法专家
5340 人已学习
新⼈⾸单¥59
登录后,你可以任选3讲全文学习
课程目录
已完结/共 19 讲
搞定音频技术
15
15
1.0x
00:00/00:00
登录|注册

14|音效三剑客:变调、均衡器、混响

你好,我是建元。
你是否很好奇《名侦探柯南》里的变声器在现实中能否实现?百万调音师能让本来唱歌跑调的人的歌声变得好听,这到底是用了什么神奇的方法?其实今天我们要讲的音频中的音效,就是为了实现这些变声、修音等特效而设计的一系列的音频处理算法。
为了实现某种特定的效果,音效算法的种类有很多,这节课我主要介绍三种常见的音效算法:变调、均衡器和混响的设计和使用方法。

变调

其实在之前讲弱网对抗部分的时候,我们在做快慢放操作时就使用到了变速不变调算法,这其实是变调算法中的一种用法。在讲算法具体实现之前我们先想一下,变调的物理含义是什么?
之前我们讲语音信号分析的时候说过,不同的人发音的基频是不一样的。而音调和基频是直接相关的,要变调其实就是要改变基频。而基频的本质是一个信号的循环周期的倒数,比如基频是 250Hz,那么当前时间的语音信号就是以 4ms 为周期的信号。我们要变调,其实就是把这个循环周期进行扩大或者缩小。
如图 1 所示,如果我们把语音信号的基频提升一倍,或者说提升一个八度或者 12 个半音,那么时域信号(绿线部分,上面为变调前,下面为变调后)语音的波形还是很相似的,只是每一个周期都缩短了一半。
再看看频域信号(红色部分)是不是变得更稀疏了?最下面的那根亮线代表的基频从 250Hz 左右提升到了大约 500Hz 的位置。由于谐波的频率是基频的倍数,所以谐波之间的间隔也变大了。
确认放弃笔记?
放弃后所记笔记将不保留。
新功能上线,你的历史笔记已初始化为私密笔记,是否一键批量公开?
批量公开的笔记不会为你同步至部落
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
  • 深入了解
  • 翻译
    • 英语
    • 中文简体
    • 中文繁体
    • 法语
    • 德语
    • 日语
    • 韩语
    • 俄语
    • 西班牙语
    • 阿拉伯语
  • 解释
  • 总结

本文深入介绍了音频处理中的三种常见音效算法:变调、均衡器和混响。其中,变调算法通过重采样和信号拼接实现音调的提升或降低,而均衡器则通过滤波器调整不同频段的音频能量分布。关于混响算法,文章提到了采样混响和人工混响效果器的生成原理,以及Schroeder和Moorer混响模型的结构。此外,文章还提到了混响生成器的参数调节和开源库的应用。总的来说,本文对音频处理中的常见算法进行了深入浅出的介绍,为对音频处理感兴趣的读者提供了一定的参考价值。

仅可试看部分内容,如需阅读全部内容,请付费购买文章所属专栏
《搞定音频技术》
新⼈⾸单¥59
立即购买
登录 后留言

全部留言(7)

  • 最新
  • 精选
  • 大土豆
    这章来的正好,我明天在部门分享音频处理,正好用的上,哈哈。日常的声音处理,各种重采样,男女生变调,音量加减,淡入淡出,变速不变调,变调不变速等,其实ffmpeg+soundtouch都可以完美实现了。我们业务开发基本是游标卡尺式的开发,看字节数组的长度就基本完事了,输入一帧PCM 4096字节,变速不变调2倍的话,输出是2048字节,那就稳了,如果是变调不变速呢,还是4096字节,如果是48000重采样成8000呢?4096/6的结果就稳了。

    作者回复: cool,学以致用。

    2021-12-22
    3
  • 四十
    老师,请问是否可以通过混响来模拟不同设备录制的声音差异,我发现不同app(尤其h5),不同设备录制出的音频,人声音色变化很大,请问这个可以通过混响来模拟吗,通过加入混响数据增强,来提高模型效果。

    作者回复: 混响主要和房间的大小结构有关系,而不同设备的音色差异主要是麦克风硬件设备的采集能力的差异。如果人声本声录制的地方混响比较小,适当的加入混响可以提升听感

    2022-04-22
    2
  • 老师,你好,用ffmpeg的均衡器filter调了重低音后出现暴音一般要怎么处理

    作者回复: 一般会加一个limiter对幅度的范围进行限制

    2022-02-24
  • tony
    通过均衡器调整达到美声效果有哪些开源项目呢?谢谢

    作者回复: 均衡器的实现github上有很多,但均衡器其实主要的是需要调节的参数。如何通过各种均衡器参数实现听感调整可以参考一下李金城的《混音全揭秘》

    2022-01-14
  • Geek_495a1c
    不知道老师有机会讲一下根据pcm分析常见的音频问题,或则有什么推荐的文章。

    作者回复: 根据PCM直接分析需要比较深的经验理解,其实分析音频的起手式一般是把链路中每个中间步骤的PCM都下载下来逐一排查是哪一步出了问题。如果直接从最终的PCM来分析问题即使是多年经验的音频工作者也是容易犯错的

    2021-12-26
  • springXu
    哈,不懂就问。像谍中谍里的,让别人说一段话后,就可以用个麦克风说的话和那位一样了。这个是如何在短时间内做到的?记得网易也有个让使用者读十句句子,就可以用TTS的方式,让这个人帮你读文章了。这又是如何实现的?

    作者回复: 哈哈这个问题正是下一节课的内容,声纹TTS或者说声纹变声

    2021-12-23
    5
  • Geek_345096
    请问下冯老师,这样理解有问题嘛。 实现变调不变速比如您说的250hz变成500hz的基频,原来周期是20ms的信号,现在周期是10ms,人听着速度变快了,想变慢就要还信号还是在20ms的时间播放,通过重构10ms的信号,时间变成20ms,可以通过往10ms信号里面加空帧实现
    2024-02-25归属地:北京
收起评论
显示
设置
留言
7
收藏
沉浸
阅读
分享
手机端
快捷键
回顶部