【EMNLP 2020 | 微软亚洲研究院精选论文解读( 四 )】编者按：EMNLP是自然语言处理领_傻大方

按关键词阅读：

本文利用 Transformer 中的注意力机制对句子进行排序。为了学习句子层面的注意力系数，研究采用了分层的结构。
EMNLP 2020 | 微软亚洲研究院精选论文解读文章插图
图10：编码器的分层结构
研究员们采用了两种预训练方法来训练该模型， Masked Sentences Prediction (MSP) 将文章中的某些句子掩盖住，然后利用上下文恢复出被掩盖的句子。
文章插图
图11：MSP 示意图
另一方面，为了减弱模型对于句子位置的依赖，研究员们提出了另一种预训练方式 Sentence Shuffling (SS) 。 SS先将文章中的句子打乱，然后依次找出原文中的句子打乱后所在的位置。
EMNLP 2020 | 微软亚洲研究院精选论文解读文章插图
图12：SS 示意图，经过打乱后原文第1句话到了第3个位置，模型第1个预测结果应该是3 ，第2个预测结果应该是1
经过以上两种预训练，在对句子排序时，研究员们将文章中的句子逐个掩盖，然后利用其他句子恢复被掩盖的句子（过程像 MSP 一样）。之后利用恢复情况对当前被掩盖的句子评分，同时用注意力系数评价其他句子在恢复当前句子的贡献。最后，通过最终评分对句子进行排序，得分最高的三个句子被选作摘要。
【EMNLP 2020 | 微软亚洲研究院精选论文解读】该方法在 CNN/DM 数据集和 NYT 数据集上都取得了非常不错的效果。并且经过验证，这个方法可以更少地依赖于句子的位置。

稿源：(未知)

【傻大方】网址：http://www.shadafang.com/c/111T314412020.html

标题：EMNLP 2020 | 微软亚洲研究院精选论文解读( 四 )

傻大方

EMNLP 2020 | 微软亚洲研究院精选论文解读( 四 )

为啥有些动画很受欢迎光盘卖的也很好，但就是不出第二季

百年战争英法百年战争是如何爆发的?

『天乐爱游戏』高热度英雄吕布为何胜率不高？提高胜率你需要学会合理开团

直播|诸暨主播太给力！光一样特产，线上销售就突破了100亿！

扬子晚报|墙砖脱落砸坏违停车辆，谁该为6万元修车费“买单”？

盗墓笔记|盗墓笔记秦岭神树剧情解密原著的坑终于填上了

可爱|抓史莱姆的萝莉来了，看颜值和可爱度，萌王也会答应

每日经济新闻|古鳌科技：董事姜小丹、章祥余减持计划届满，未减持

「央视」菲律宾驻瑞典名誉总领事因感染新冠肺炎去世

研究人员开发AI国际象棋引擎“玛雅” 可帮棋手识别技能错误