人人都是产品经理智能剪辑功能调研报告:详解抖音的音乐卡点模式( 二 )


跨域竞品:大疆、Quik
人人都是产品经理智能剪辑功能调研报告:详解抖音的音乐卡点模式
本文插图
根据上表的概览 , 会发现【智能剪辑】功能的核心要素有三个:剪裁、音乐和视觉 。
首先 , 算法会对素材内容进行分析 , 识别素材的场景 , 然后匹配对应的音乐和动效 。
每个音乐都会有相应的节拍点 , 根据节拍点 , 会对每段素材剪裁为一定的播放长度 , 然后拼接在一起 。
这里会出现另一个问题 , 就是怎么找到每段素材中的高质量精彩片段?
因此也需要借助算法 , 识别和筛选素材中的精彩片段进行合理剪裁 。
而视觉效果包括转场特效、画面装饰、滤镜、贴纸等 , 也需要识别素材的对应场景进行匹配 。
通过上述的分析会发现 , 根据剪裁、音乐、动效三者之间的关系 , 市面上主流的【智能剪裁】功能的模式有三种:
(1)【音乐可选+无动效】:音乐根据素材进行匹配和推荐 , 可手动切换 , 素材会根据音乐再次剪裁 , 无转场、页面装饰等视觉效果 , 典型代表是抖音;
(2)【音乐固定+动效固定】:音乐和动效绑定 , 两者都是固定的 , 不能组合 , 也就是集成为“模板” , 每个模板的剪裁也是固定的 , 此时需要用户自己手动选择模板 , 典型代表是微视;
(3)【音乐可选+动效可选】:音乐根据素材进行匹配和推荐 , 可手动切换 , 素材会根据音乐再次剪裁 , 同时转场、页面装饰等视觉效果集成为统一风格的“主题” , 可进行切换 , 典型代表是快手和VUE 。
2. 核心竞品详述
根据以上分析 , 音乐智能匹配和视频精彩片段智能选取 , 这两个关键环节主要依靠算法解决 , 对于用户而言相当于黑盒 。
而另一个关键点 , 怎么依靠音乐节拍点划分素材的长度 , 则有规律可循 , 因此 , 下文将针对抖音的音乐卡点模式进行简单实验 , 推测其智能剪裁规则 。
人人都是产品经理智能剪辑功能调研报告:详解抖音的音乐卡点模式
本文插图
整体分为三个环节:导入素材、制作流程、发布 。
导入素材:可同时导入图片和视频 , 素材总数的上限是35 。
制作流程:默认音乐卡点模式 , 会根据匹配的音乐 , 对素材进行裁剪 , 也可以手动调整素材片段的顺序 , 但是因为每个音乐的卡点位置是固定的 , 因此每个素材片段剪裁的长度也是固定的 , 只能调整每段素材剪裁的位置 。
举个例子 , 我上传了4段视频 , 基于匹配的音乐自动剪裁后 , 4段素材分别的长度为:5.6s、4.4s、4.4s、5.6s 。
现在我将第4段素材(有人像)的位置从第4个位置移动到第2个位置 , 然后第4段视频(有人像)的长度从5.6s转变为4.4s , 也就是说根据素材的数量会计算音乐卡点的位置 , 分配相同数量的位置 , 每个位置的长度是固定的 。
人人都是产品经理智能剪辑功能调研报告:详解抖音的音乐卡点模式
本文插图
【人人都是产品经理智能剪辑功能调研报告:详解抖音的音乐卡点模式】
接下来 , 将通过简单实验 , 归纳总结其裁剪规则 。
人人都是产品经理智能剪辑功能调研报告:详解抖音的音乐卡点模式
本文插图
人人都是产品经理智能剪辑功能调研报告:详解抖音的音乐卡点模式
本文插图
人人都是产品经理智能剪辑功能调研报告:详解抖音的音乐卡点模式
本文插图
在此次简单实验中 , 通过将素材总时长逐渐增加 , 从3秒到890秒 , 我们可以看到以下规律:
(1)素材数量>=2时 , 才能进入【音乐卡点】模式;
(2)素材总时长30秒左右是临界点总时长在30秒以下的素材 , 裁剪后保留的比例为55%~60%;总时长在30秒以上、50秒以下的素材 , 裁剪后保留的时长逐渐贴近20秒 , 保留的时长不再有大幅的增加;总时长在50秒以下的素材 , 裁剪后保留的时长稳定在20秒左右 , 因此保留的比例会迅速下跌;