人工智能■京东商城背后的AI技术能力揭秘 - 基于关键词自动生成摘要( 二 )
论文中构建了一个中文商品摘要数据集 , 该数据集包含约140万个“商品-摘要”对 , 涵盖家电、服饰和箱包品类 。 在该数据集上的实验结果表明 , 文中提出的模型在自动评价和人工评价指标上都显著优于其他对比方法 。
本文插图
模型介绍
如图2所示 , 论文中提出的商品摘要模型基于指针-生成器网络(Pointer-Generator) 。 采用了三种策略将商品图像信息融入模型中 , 包括使用商品图片的全局特征初始化编码器 , 使用商品图片的全局特征初始化解码器 , 以及使用商品图片的局部特征 , 通过注意力机制生成图片上下文向量参与解码 。
本文插图
图2
首先 , 对商品要素进行建模(所谓的商品要素 , 就是商品不同方面的属性 。 例如:对洗衣机而言 , 商品要素包括容量和能耗等) , 然后从商品的要素出发 , 对摘要的重要性、非冗余性和可读性进行建模 。
(1)采用基于商品要素的RAML(reward augmented maximum likelihood)训练 , 鼓励模型生成的摘要涵盖商品的特色要素 。 如图2(b)所示 , 该商品ground-truth特色要素是容量、操控与电机 , 则该模型将会鼓励生成描述容量、操控与电机相关的文本;
(2)采用基于商品要素的覆盖度机制消除冗余信息 。 传统覆盖度机制仅能在词维度进行去冗余 , 难以处理相关词冗余问题 。 如图2(c)所示 , “noise”、“quiet”和“tranquil”均在描述“运行声音”这一商品要素 , 如果仅对“noise”进行去冗余 , 难以保证“quiet”和“tranquil”不出现摘要中 。 本文提出的模型通过商品要素维度的去冗余 , 可以避免“noise”、“quiet”和“tranquil”同时出现在摘要中;
(3)通过商品要素放回跳机制提高摘要的可读性 。 如图2(d)所示 , 商品要素的回跳描述降低了商品摘要的连贯性 , 影响了消费者的阅读体验 。 本文提出的模型通过解码时禁用回跳要素词 , 有效地避免了这一现象 。
本文插图
实验结果
如表1所示 , 本文提出的带有的多模态商品摘要模型 , MMPG模型取得了比所有基于纯文本的模型更好的结果 , 这证明了商品视觉信息和商品要素信息在商品摘要任务中起着重要的作用 。
本文插图
表1
本文插图
总结
论文提出了一个多模态商品摘要模型 , 其可以利用商品图像、标题和其他文本介绍 , 为商品生成摘要 。 文中提出的模型可以有效地利用商品的视觉信息 , 并反映商品的特色要素 , 从重要性、非冗余性和可读性的角度对商品要素进行了有效的建模 。
对于电商而言 , 海量商品的营销内容在由达人供稿的过程中 , 受限于达人写作的效率限制 , 商品更新速度明显高于营销内容上线速度 , 导致内容短缺 。
本文插图
AI生成内容在生成效率、曝光点击率、订单转化率等方面其实都表现出了优于人工创作营销的内容 。 该方法正在应用于垂直电商、综合电商、社交电商、新媒体平台等众多场景 。
【end】
本文插图
- 用于单图像超分辨率的对偶回归网络 , 达到最新SOTA | CVPR 2020
- 【乐居网】京东徐雷谈瑞幸财务造假:对中企形象影响是破坏性的
- 2020改变就在眼前,量化派助力多行业人工智能化
- CNBC:京东智联云打造欧美企业在华首选技术服务平台
- 『接风娱乐』人机对战协作新时期已经来临,提高智能化与人工智能技术趋于结合
- 游戏谈▲人工智能上线助力疫情!5天时间如何如何完成?
- 『我的第一部5G手机』4月京东手机换新季 游戏嗨玩日以旧换新至高补贴5400元
- 『京东商城』京东零售CEO徐雷人民日报发文:发展智能物流和智能供应链是新基建应有之义
- 时期@河北的一个市,有“京东明珠”的美誉,也是全国百强县!
- 只要地主斗的好没有手机换不了速来京东418免费换新机
- 京东商城:京东数科投资智能钥匙管理平台“智辉空间”