类产品|AI技术在音乐类产品中的应用场景:你听的歌是AI写的?

编辑导读:你有没有想过,也许有一天,我们听的音乐都是AI作曲作词演唱的。随着AI人工智能的发展,它在各行各样的应用也越来越深度。在未来,AI在音乐类的产品会有怎样的应用场景呢?本文将从四个方面展开分析,希望对你有帮助。
类产品|AI技术在音乐类产品中的应用场景:你听的歌是AI写的?
文章插图
自动标注、平滑过渡、音乐鉴权、AI创作,当AI技术应用于音乐行业为人类的精神文化与娱乐生活带来便利和更多选择时,也是一件让人激动不已的事情。
随着深度学习算法的出现、大数据和5G技术的成熟,AI人工智能已逐渐融入我们的生产生活中,在教育、医疗、政务办公、城市管理等多个方面发挥作用。
随着AI技术在音乐行业研究及应用的深入,音乐人工智能已经不新鲜,很多新的应用和产品已经惊艳亮相。
基于对于音乐技术及产品的了解,简单梳理一下目前AI技术在音乐类产品的各类应用场景。
一、自动标注当平台曲库量达到?定量级时,如果再依赖传统的?为打标签模式就会花费?量成本且受到主观影响较?。?频?动标注相关技术就受到?泛关注,?动标注的作?不仅仅只是能替代??标注以达到节省成本,同时可以客观评价?乐内容,因此还可以拓展到流媒体播放的?乐推荐??。
例如:Spodify、KKBOX都有利?深度学习做推荐,其中KKBOX采??频?件、歌词以及?户相关标注和评论等数据作为输?从曲?、场景及情绪等多个维度来判断?乐是否满?推荐的条件。?般的?动标注功能也和KKBOX的推荐维度类似,从曲?、应?场景、器乐和情绪等维度来进?标注。
类产品|AI技术在音乐类产品中的应用场景:你听的歌是AI写的?
文章插图
(示例:笔者所在公司旗下平台,关于音乐标注的标签)
对于?动标注,笔者也在?上听到过一些不太专业的吐槽,比如之前有看到说音频自动标注可能会出现将一首歌曲的情绪同时标注为“欢乐”和“悲伤”两种情绪。
在解释这?原因之前,可以简单普及?下机器学习中分类器、单标签多分类任务和多标签多分类任务。
简单来说,分类器就是利?已知的输?和输出数据来训练,然后该分类器就会对未知的输?数据进?分类或输出?个值。对于?个分类器模型,它预测的结果是2个或?于2个以上的(结果只有1个代表结果确定就不需要分类模型了)。如果可能的结果数为2称之为?分类任务?于2就是多分类任务;对于情绪可能有:?亢、欢快、安静、悲伤等多个结果,因此情绪分类是?个多分类任务。
如果认为情绪模型是?个单标签多分类任务,那么绝对是不可能出现”欢乐“和”悲伤”同时出现的情况。如果同时出现“欢乐”和“悲伤”,则只能存在于多标签多分类任务。
?“欢乐”和“悲伤”同时出现就?定是错误的吗?也不?定!
基于深度学习的?乐处理?式?般是分段处理,也就是将???乐划分为多个?段然后对每?个?段进?预测判断它可能的标签。如果??歌曲情绪存在波动,比如一首歌曲的情绪从开始的“欢乐”转向了“悲伤”,那么这种情况也是完全可能出现,现实?活中很多歌曲的确是存在多个情绪甚?互斥的标签存在的情况。
二、平滑过渡平滑过渡功能是近?年新出现的“炫酷”功能。
简单理解,就是当??歌曲快要播放完毕时下??歌曲可能?缝接?,这种歌曲间的平滑过渡,不会让听众觉得非常突兀。
这种功能的实现,也有依赖于基于深度学习的技术。
?致原理是将歌曲的末尾?段和可能平滑过渡的其他歌曲的头部?段作为训练样本。训练出来的模型可以预测当前输??段可以过渡的下?个?段,然后当播放器播放?歌曲尾部?段的时候利?该模型得到可平滑过渡的下??歌曲。
三、音乐鉴权互联网上的音乐侵权一直存在,但音乐版权方要在互联网上维护自己的权益,往往比较困难。
因为互联网具有海量的内容,而且内容形式具有复合性,比如音乐内容仅仅作为视频的背景音乐,靠人工去发现和识别,难度太大。
在这方面,AI技术的运用,已经能够实现实时监控视频、直播或?播节?中是否有存 在歌曲的侵权情况。
其中的原理是,将版权?的曲库中歌曲提取出关键特征保存在集群数据库,然后提取待检测的?频特征,并通过?数据技术进?快速检索数据库中是否存在相似数据。
目前,拥有类似技术的公司,除了笔者所在公司外,ACRCloud也较具有代表性。
四、AI创作当AI进入到音乐创作层面,在互联网行业也已有不少AI音乐创作工具,Amper Music、AIVA、Jukedeck、Ecrett Music、Melodrive、等ORB Composer等。