科学家首次用AI直接从大脑合成语音
极客时间编辑部
讲述:丁婵大小:1.32M时长:02:53
最近,《自然》杂志上发表了一篇主题为“利用人工智能将脑信号转化为语音”的文章,文章显示,来自加州大学旧金山分校的研究人员已经可以通过 AI,将实验对象的脑信号成功转换为语音并进行播放。从脑机接口研究方向来说,这是一项重大的进步。
随着科技的发展,失去说话能力的人已经可以通过技术手段来进行交流,不过,这些技术依然需要他们做一些微小的动作,来控制在屏幕上选择字母或单词的光标。患有运动神经元疾病的英国物理学家斯蒂芬霍金就是一个例子。
现在,利用人工智能技术,科学家或许可以让丧失语言能力的人开口“讲话”。
这个听上去有些天方夜谭的事情,近期在加州大学旧金山分校成功实现了,研究负责人爱德华·常(Edward Chang)表示,为严重言语残疾患者创造恢复沟通的技术是一项长期目标。这项研究提供了原理证明,可以从大脑活动中产生语音,特别是大脑的语音中心。
在文章中,爱德华对这项研究的进展进行了详细地解析。他解释说,使用脸颊肌肉激活的发声装置的人必须逐字逐句地打印单词,所以这些设备的速度非常慢,每分钟最多能打印 10 个单词,而普通人的自然口语速度为平均每分钟 150 个单词。所以,他的团队决定在构建神经解码器时对声音系统进行建模。
这项实验的参与者,是 5 位正在加州大学旧金山分校医疗中心接受侵入性治疗的癫痫患者。治疗方式是将手掌大小的电极板直接植入在他们的大脑表面上,患者癫痫发作后,电极可以在大脑中发生的地方产生定位。一旦医生确定了发病点,就可以通过移除大脑的病变部分以永久停止癫痫的发作。
当然,除了治疗癫痫之外,这块电极还有一些其他作用,即捕捉语言相关的脑信号。
参与者需要大声朗读数百个句子,此时的大脑活动会被研究人员记录下来,并确定哪些信号控制了所谓的发声器官。通过参与者足够的脑信号数据,科学家们能够创建一个计算机模拟的声道。
研究人员还设计了一种循环神经网络(RNN),可以将记录的皮质神经信号转化为声道咬合关节运动,然后将这些解码的运动转化为口语句子。
公开
同步至部落
取消
完成
0/2000
荧光笔
直线
曲线
笔记
复制
AI
- 深入了解
- 翻译
- 解释
- 总结
该免费文章来自《极客视点》,如需阅读全部文章,
请先领取课程
请先领取课程
免费领取
© 版权归极客邦科技所有,未经许可不得传播售卖。 页面已增加防盗追踪,如有侵权极客邦将依法追究其法律责任。
登录 后留言
精选留言
由作者筛选后的优质留言将会公开显示,欢迎踊跃留言。
收起评论