作者回复: A1: 高频指的是:图像强度变化剧烈的地方,也就是我们常说的边缘部分;低频值的是:图像强度变换平缓的地方,也就是大片色块的地方;非常经典的一个场景就是磨皮效果器,也叫保边滤波; A2:就是mp4格式的了;如果要写入到mp4文件中去,需要mp4封装格式的H264而不是Annexb格式的H264; A3:目前没有这样的软件吧,因为歌曲生成的歌词是需要详细标注的,标注之后才能有音素的模版,最终才可能按照这个模版结合你的语音模型去生成一个音乐。