Facebook发布神经蛋分离法,提取嘈杂音频
极客时间编辑部
讲述:丁婵大小:1.82M时长:02:00
一直以来,分离混合分布都是机器学习和信号处理的长期挑战,近日,Facebook 提出的新方法似乎可以有效解决这一难题。
人类天生善于分离个别声音和视觉效果,例如在拥挤的酒会上听到别人的声音,或者在动物穿过灌木丛时发现动物。但是,依赖于机器学习的应用程序通常很难完成这项任务。
解决这一问题的监督方法,包括对每个来源的样本进行培训,以及假定大量的训练数据,都不一定能够取得很好的效果,而完全无监督的方法会使模型对混合信号源做出不准确的假设。
对此,Facebook 的研究人员提出了神经蛋分离法 NES(Neural Egg Separation),据官方解释,这一方法的命名灵感来源于鸡蛋,意思是像分离蛋清和蛋黄一样,把清晰的音视频从模糊的信号中提取出来。
这是一种半监督的方法,结合了训练和估计的各个方面。在这一迭代方法中,系统通过将信号混合在一起,并进行多个分析来分离已知和未知的分布。
在这个过程中,系统逐渐将更多的已知信号注入混合信号中,同时,模型在隔离和提取时不断改进。实验表明,NES 明显优于采用类似监督的其他方法,即使对使用全面监督的系统,NES 方法也具有竞争力。
此外,除了改善 ML 系统在逼真的杂乱和嘈杂条件下理解音频和视觉输入的能力之外,这种方法还可以通过应用增强人们隔离信号的自然能力。比如,可以应用在音乐会(或类似场景)中的音频、视频记录,或者开发基于 AR 的应用,用来实时放大特定音频源或视觉特征。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
全部留言(1)
- 最新
- 精选
- minkvsky降噪耳机
收起评论