音乐人工智能的发展与思考( 三 )


图9:短视频中对口型辨识的应用
5、AI作曲
关于这一问题 , 音乐界一直有不少争论 , 更多的是不太认同AI作曲的水准 , 以及偏离了人类的审美风格、缺乏大局观 。 我认为这个问题 , 与我们从何种角度来评价AI作曲的品质有关 。 这里不妨想想周星驰的《大话西游》里唐僧对妖怪说的一句话“人是人生的 , 妖是妖生的 , 妖如果有了仁慈的心 , 就不是妖了 , 是人妖” 。
音乐人工智能的发展与思考文章插图
图10:AI作曲的思考
如果我们把AI作曲定义成是为人类服务的 , 那很有可能就会出现上述情况 。 但如果想想 , 未来的AI本身就是主体呢 , 也许它的作品不一定是需要为人类服务的 。 据报道 , 日本曾经让一组机器人相互交流 , 结果 , 它们最终似乎发明了人类听不懂的语言 , 并能用之来交流 。
也许 , AI作曲也有可能会发展出机器能欣赏但人类不知道如何欣赏的作品 。 考虑到机器的计算速度极其地高 , 有可能它们会作出毫秒级的音乐作品 , 来供其自我欣赏 。
三、音乐智能的市场
尽管音乐和人工智能在很多特质上是有明显差异的 , 但必须承认地是 , 音乐市场中智能化的蛋糕还相当地大 。 毕竟人的精力是有限的 , 一个专业的音乐人不可能同时指导太多学习者 , 而机器由于有强大的算力支持 , 它是可以大幅度减少指导过程中不必要的专家指导行为和降低学习成本 , 以及提高学习效率的 。 比如钢琴练习中 , 每周老师可能也就指导一至两次 , 期间的空档需要学生自己去练习 。 如果人工智能能在学生练习期间给予适当的指导、纠错 , 显然可以更好地提高学习效率 。 我们也不难想象 , 其中可以指导的人数有多大 , 市场有多大 。
四、问题:大数据对音乐风格和学习的影响
音乐风格一直有很多新的形式在出现着 , 但大数据有可能帮助我们发现更多人类未见过的风格 。 这一点类似于AlphaGo下围棋 。 它通过短时间3000万局的训练 , 发现了人类300年棋谱中未见的绝妙棋着 , 以至于现在很多围棋比赛中国棋选手都开始选择用AlphaGO用过的落子方式下棋 。
人类在学习音乐时 , 也存在同样的情况 。 因为人不可能做像机器这样的学习 , 所以一旦模型用对了 , 机器就有可能通过大数据、海量计算发现更多新的音乐风格或有趣的旋律 。 当然 , 它和人类是有着本质区别的 , 人类可以通过有限量的学习来实现直觉、顿悟和创作 , 但目前的机器还是通过时间换空间的方式 , 依靠强大的硬件计算能力来实现这一功能的 。
音乐人工智能的发展与思考文章插图
图11:音乐的美与平衡智能
五、音乐的美与人工智能的预测
对我们来说 , 音乐是美的 。 这种美往往是来自于一种平衡 , 它有点像国人常说的阴阳八卦 , 是一种相互制衡后形成的 。 它既有节奏、伴奏、人声与乐器声等因素的平衡 , 也有对各种情绪的平衡 , 还有个体主观感受和大人感受的平衡 , 因此我们在研究音乐的时候 , 可能需要更多的考虑其中的平衡 , 而不能像目前人工智能绝大多数研究那样 , 只关注预测性能的优越 。 如果过多的关注后者 , 很有可能会走入类似量子力学中的不确定性原理的一个极端 , 即得到了优异的预测性能 , 却丢失了美或平衡 。
这一点 , 可能需要从事音乐人工智能的研究者多多思考下 , 如何在音乐的美与人工智能的预测之间找到平衡点 。
张军平
2020年11月9日
注:部分用图来自网络