• 大土豆
    2021-12-22
    这章来的正好,我明天在部门分享音频处理,正好用的上,哈哈。日常的声音处理,各种重采样,男女生变调,音量加减,淡入淡出,变速不变调,变调不变速等,其实ffmpeg+soundtouch都可以完美实现了。我们业务开发基本是游标卡尺式的开发,看字节数组的长度就基本完事了,输入一帧PCM 4096字节,变速不变调2倍的话,输出是2048字节,那就稳了,如果是变调不变速呢,还是4096字节,如果是48000重采样成8000呢?4096/6的结果就稳了。

    作者回复: cool,学以致用。

    
    3
  • 四十
    2022-04-22
    老师,请问是否可以通过混响来模拟不同设备录制的声音差异,我发现不同app(尤其h5),不同设备录制出的音频,人声音色变化很大,请问这个可以通过混响来模拟吗,通过加入混响数据增强,来提高模型效果。

    作者回复: 混响主要和房间的大小结构有关系,而不同设备的音色差异主要是麦克风硬件设备的采集能力的差异。如果人声本声录制的地方混响比较小,适当的加入混响可以提升听感

    共 2 条评论
    
  • 劝
    2022-02-24
    老师,你好,用ffmpeg的均衡器filter调了重低音后出现暴音一般要怎么处理

    作者回复: 一般会加一个limiter对幅度的范围进行限制

    
    
  • tony
    2022-01-14
    通过均衡器调整达到美声效果有哪些开源项目呢?谢谢

    作者回复: 均衡器的实现github上有很多,但均衡器其实主要的是需要调节的参数。如何通过各种均衡器参数实现听感调整可以参考一下李金城的《混音全揭秘》

    
    
  • Geek_495a1c
    2021-12-26
    不知道老师有机会讲一下根据pcm分析常见的音频问题,或则有什么推荐的文章。

    作者回复: 根据PCM直接分析需要比较深的经验理解,其实分析音频的起手式一般是把链路中每个中间步骤的PCM都下载下来逐一排查是哪一步出了问题。如果直接从最终的PCM来分析问题即使是多年经验的音频工作者也是容易犯错的

    
    
  • springXu
    2021-12-23
    哈,不懂就问。像谍中谍里的,让别人说一段话后,就可以用个麦克风说的话和那位一样了。这个是如何在短时间内做到的?记得网易也有个让使用者读十句句子,就可以用TTS的方式,让这个人帮你读文章了。这又是如何实现的?

    作者回复: 哈哈这个问题正是下一节课的内容,声纹TTS或者说声纹变声

    共 5 条评论
    