人人都是产品经理智能剪辑功能调研报告：详解抖音的音乐卡点模式( 二 )

跨域竞品：大疆、Quik

本文插图
根据上表的概览，会发现【智能剪辑】功能的核心要素有三个：剪裁、音乐和视觉。
首先，算法会对素材内容进行分析，识别素材的场景，然后匹配对应的音乐和动效。
每个音乐都会有相应的节拍点，根据节拍点，会对每段素材剪裁为一定的播放长度，然后拼接在一起。
这里会出现另一个问题，就是怎么找到每段素材中的高质量精彩片段？
因此也需要借助算法，识别和筛选素材中的精彩片段进行合理剪裁。
而视觉效果包括转场特效、画面装饰、滤镜、贴纸等，也需要识别素材的对应场景进行匹配。
通过上述的分析会发现，根据剪裁、音乐、动效三者之间的关系，市面上主流的【智能剪裁】功能的模式有三种：
（1）【音乐可选+无动效】：音乐根据素材进行匹配和推荐，可手动切换，素材会根据音乐再次剪裁，无转场、页面装饰等视觉效果，典型代表是抖音；
（2）【音乐固定+动效固定】：音乐和动效绑定，两者都是固定的，不能组合，也就是集成为“模板” ，每个模板的剪裁也是固定的，此时需要用户自己手动选择模板，典型代表是微视；
（3）【音乐可选+动效可选】：音乐根据素材进行匹配和推荐，可手动切换，素材会根据音乐再次剪裁，同时转场、页面装饰等视觉效果集成为统一风格的“主题” ，可进行切换，典型代表是快手和VUE 。
2. 核心竞品详述
根据以上分析，音乐智能匹配和视频精彩片段智能选取，这两个关键环节主要依靠算法解决，对于用户而言相当于黑盒。
而另一个关键点，怎么依靠音乐节拍点划分素材的长度，则有规律可循，因此，下文将针对抖音的音乐卡点模式进行简单实验，推测其智能剪裁规则。

本文插图
整体分为三个环节：导入素材、制作流程、发布。
导入素材：可同时导入图片和视频，素材总数的上限是35 。
制作流程：默认音乐卡点模式，会根据匹配的音乐，对素材进行裁剪，也可以手动调整素材片段的顺序，但是因为每个音乐的卡点位置是固定的，因此每个素材片段剪裁的长度也是固定的，只能调整每段素材剪裁的位置。
举个例子，我上传了4段视频，基于匹配的音乐自动剪裁后， 4段素材分别的长度为：5.6s、4.4s、4.4s、5.6s 。
现在我将第4段素材（有人像）的位置从第4个位置移动到第2个位置，然后第4段视频（有人像）的长度从5.6s转变为4.4s ，也就是说根据素材的数量会计算音乐卡点的位置，分配相同数量的位置，每个位置的长度是固定的。

本文插图
【人人都是产品经理智能剪辑功能调研报告：详解抖音的音乐卡点模式】
接下来，将通过简单实验，归纳总结其裁剪规则。

本文插图

本文插图

本文插图
在此次简单实验中，通过将素材总时长逐渐增加，从3秒到890秒，我们可以看到以下规律：
（1）素材数量>=2时，才能进入【音乐卡点】模式；
（2）素材总时长30秒左右是临界点总时长在30秒以下的素材，裁剪后保留的比例为55%~60%；总时长在30秒以上、50秒以下的素材，裁剪后保留的时长逐渐贴近20秒，保留的时长不再有大幅的增加；总时长在50秒以下的素材，裁剪后保留的时长稳定在20秒左右，因此保留的比例会迅速下跌；