• Geek_b6a303
    2022-03-08
    老师,在训练中,对于噪声与纯净声mix时的信噪比该如何把控,每次统一相同的信噪比,还是设置多种信噪比的数据放在一起进行训练?

    作者回复: 信噪比应该是要多样的,一般-6到18dB的常见情况都需要考虑

    
    
  • pencilCool
    2022-01-26
    "但只改变相位谱的频域掩码不能做到对纯净语音的完美重建。听感上还是能听出一些不同。" 这里是不是有个typo。 应该是“但**不**改变相位谱的频域掩码不能做到。。。”

    作者回复: 多谢指正

    
    
  • 坚坚
    2021-12-09
    老师,请问AI降噪也是和基于统计模型一样具备实时降噪特性吗? 训练后的模型还会根据过程中不同环境,自动调节网络参数吗?

    作者回复: 是的,AI降噪实际上是把不同环境的决策放到了模型里统一考虑,所以实施降噪时面对不同的情况也能自动调整应对。

    
    
  • ForwardsHao
    2021-12-05
    老师 在前面介绍常用模型结构的地方,说到了“多层的线性网络”,这个应该是描述不准确的,网络要效果好,重要的是加入了非线性激活函数,单纯的线性函数叠加是不会有逼近任意函数的效果的,也就起不到好的效果的,每一层都不是简单的前一层的加权平均

    作者回复: 是的,激活函数是可以增加模型的非线性处理能力。其实最早的BP network是没有激活函数的所以对某些场景的表现一直不佳。篇幅有限激活函数加还是不加、加什么样的这里就不具体讨论了。

    
    
  • Geek_7de4c5
    2021-12-03
    基于频域掩码的 AI 降噪算法能给个demo吗?

    作者回复: https://github.com/xiph/rnnoise,可以看看这个经典的RNNnoise

    
    
  • 晓龙
    2021-12-03
    想要什么声音,就可以将目标数据设置成什么声音,例如需要过滤人声,保留音乐声,就将人声+音乐声作为输入,音乐声作为输出,然后经过AI模型,对比目标,求loss,调整AI模型参数,循环往复,直到梯度下降到一个稳定的数值,这个模型就能过滤人声,保留音乐声。 当然以上还设计到很多细节,例如网络选择,声音预处理,语料库等

    作者回复: 回答的不错

    
    
  • 徐刚
    2021-12-03
    有AI降噪的工程实践例子吗(从训练到工程落地)方便我们小白更加明白ai降噪的操作流程

    作者回复: 可以用开源的RNNnoise,练个手https://github.com/xiph/rnnoise

    
    
  • 罗 乾 林
    2021-12-03
    人声+噪音 -> 人声 人声+音乐+噪声 -> 人声+音乐 音乐+噪声-> 音乐

    作者回复: 大体如是,其实这里的难点是区分音乐和噪声。这个在行业内也是一个难点

    
    
  • 勿更改任何信息
    2023-04-05 来自北京
    请问老师,如果收音的时候有导航声音录进去了,该怎么降噪去除呢
    
    
  • 刘浩
    2022-10-10 来自北京
    AI 降噪模型训练步骤里的第二步: “通过 AI 降噪模型得到估计的纯净语音信号”,那这里说的“AI降噪模型”是怎么来的呢
    
    