从人类与外界交互的渠道来说,确实也就视觉和听觉信息吞吐量较大和有意义了。对应的也就是图像和声音。图像这一块得是三维的,而视觉器官眼睛其实也只能是作为信息接收方而不是发送方。VR等领域的应用不能光靠视觉,VR应该是一个集各种感知之综合的体验,而且VR由于信息量太大,目前还不能真正投入日常生活使用。而声音则很简单,与声音有关的人体器官有耳(接收方)和嘴(发送方),就声音这一维,再加上人类语言长久以来形成的稳定信息编码,语音交互到目前为止真的是人类最简单且最能直接使用的交互方式。苹果作为推出语音助手Siri的先驱者,没能意识到语音交互不应该局限于手机这一硬件上,而是走了音质流路数,实属遗憾。真可谓“当我们谈到智能音箱的时候,我们其实不是在谈音箱”。语音交互,实乃交互方式选择的必然。