极客时间-轻松学习，高效学习-极客邦

大土豆
2021-12-22
这章来的正好，我明天在部门分享音频处理，正好用的上，哈哈。日常的声音处理，各种重采样，男女生变调，音量加减，淡入淡出，变速不变调，变调不变速等，其实ffmpeg+soundtouch都可以完美实现了。我们业务开发基本是游标卡尺式的开发，看字节数组的长度就基本完事了，输入一帧PCM 4096字节，变速不变调2倍的话，输出是2048字节，那就稳了，如果是变调不变速呢，还是4096字节，如果是48000重采样成8000呢？4096/6的结果就稳了。
作者回复: cool，学以致用。
3
四十
2022-04-22
老师，请问是否可以通过混响来模拟不同设备录制的声音差异，我发现不同app（尤其h5），不同设备录制出的音频，人声音色变化很大，请问这个可以通过混响来模拟吗，通过加入混响数据增强，来提高模型效果。
作者回复: 混响主要和房间的大小结构有关系，而不同设备的音色差异主要是麦克风硬件设备的采集能力的差异。如果人声本声录制的地方混响比较小，适当的加入混响可以提升听感
共 2 条评论
劝
2022-02-24
老师，你好，用ffmpeg的均衡器filter调了重低音后出现暴音一般要怎么处理
作者回复: 一般会加一个limiter对幅度的范围进行限制
tony
2022-01-14
通过均衡器调整达到美声效果有哪些开源项目呢？谢谢
作者回复: 均衡器的实现github上有很多，但均衡器其实主要的是需要调节的参数。如何通过各种均衡器参数实现听感调整可以参考一下李金城的《混音全揭秘》
Geek_495a1c
2021-12-26
不知道老师有机会讲一下根据pcm分析常见的音频问题，或则有什么推荐的文章。
作者回复: 根据PCM直接分析需要比较深的经验理解，其实分析音频的起手式一般是把链路中每个中间步骤的PCM都下载下来逐一排查是哪一步出了问题。如果直接从最终的PCM来分析问题即使是多年经验的音频工作者也是容易犯错的
springXu
2021-12-23
哈，不懂就问。像谍中谍里的，让别人说一段话后，就可以用个麦克风说的话和那位一样了。这个是如何在短时间内做到的？记得网易也有个让使用者读十句句子，就可以用TTS的方式，让这个人帮你读文章了。这又是如何实现的？
作者回复: 哈哈这个问题正是下一节课的内容，声纹TTS或者说声纹变声
共 5 条评论