DeepTech深科技 发长篇论文解析,牛津大学博士后试图撬开深度神经网络黑箱
无疑 , 深度神经网络(DNN)在计算机视觉、自然语言处理和语音识别等各个领域的应用都取得了成功 。
然而 , DNN模型的决策过程却通常无法很好地呈现给使用者 , 即可解释性较差 , 是个黑箱 。
这一点在医疗、金融或法律等领域显得尤为重要 , 有的时候为了弄清楚模型得出每一步结论的原因 , 开发者甚至不得不使用更简单的模型(线性模型或决策树) 。
近期 , 牛津大学博士后研究员瓦娜(Oana-MariaCamburu) , 发表了一篇名为“ExplainingDeepNeuralNetworks”的预印本论文 , 使用一百多页的篇幅对这个话题展开了详细研究 。
论文中 , 瓦娜研究了解释深度神经网络的两个主要方向 。
第一种方法 , “事后”解释 。
一般适合于解释已经训练和固定后的模型 , 该方法让模型在给出结果的同时 , 同时罗列影响决策的关键特征信息 , 如词组(Token)、超像素(Superpixels) 。
文章图片
【DeepTech深科技 发长篇论文解析,牛津大学博士后试图撬开深度神经网络黑箱】图|两个解释器分别给出至少两个基于特征的解释示例 , 这也说明了其“忠实解释”的不唯一性 。
第二种方法 , 自解释(内置解释模型) 。 即将能使用自然语言输出解释内容的神经网络模型内置到需要解释模型中 。
文章图片
图|a:BiLSTMMax-PredExpl;b:BiLSTM-Max-ExplPred-Seq2Seq;c:BiLSTMMax-ExplPred-Att的预测标签和生成解释的例子 , 方括号中为正确性评分 。
瓦娜在论文中深入剖析了这两个方向 , 并分别给出了各自的优劣势 。
首先 , 作者阐述了仅使用输入特征解释模型的局限性 , 即便是非常简单的模型也是如此 。
大多数的情况 , 对于同一种结果的“忠实解释”并非只有一种 。 例如 , 一个人愉悦的原因有很多 , 而当仅仅凭愉悦的结果和输入的词组去“推测”时 , 这样的解释往往离题甚远 , 可能会导致严重的判断失误 。
瓦娜展示了两种有影响力的解释器 , Shapley解释器和最小子集(minimalsufficientsubsets)解释器 , 它们分别擅长解释不同类型的模型 。 但在论文中 , 它们的表现都不够完美 , 某些情况下 , 它们都不足以提供决策的完整视图 。
其次 , 作者介绍了一个用于自动验证“事后”解释真实性的框架 。
该框架依赖特定类型的模型 , 它有望提供其决策过程的全部细节 。 作者分析了这种方法的潜在局限性 , 并介绍了缓解这些局限性的方法 。
瓦娜引入的验证框架是通用的 , 可以在不同的任务和域上实例化 , 以提供现成的健全性测试(sanitytest) 。
最后 , 关于生成自解释神经模型的方向(模型为结果提供自然语言解释) , 作者在斯坦福自然语言推理(SNLI)数据集的基础之上 , 收集了约570K的人类书面自然语言组成了解释的大型数据集——e-SNLI 。
文章图片
图|e-SNLI数据集的示例 。 注释中提供了前提、假设和标签 , 强调了对标签高权重词语 , 并提供了解释 。
作者进行了一系列实验 , 研究了DNN模型在测试时生成正确的自然语言解释的能力 , 以及在训练时提供自然语言解释的好处 。
她证明了当前的自解释模型为预测生成自然语言解释时 , 可能会产生不一致的解释 , 例如“图像中有一条狗”和“图像中没有狗” 。 不一致的解释表明 , 要么解释没有如实地描述模型的决策过程 , 要么是模型学习了有缺陷的决策过程 。
文章图片
图|自解释模型BiLSTM-Max-PredExpl架构图
- 科技日报|塑料微粒影响几何?人类认知仍不足
- 量子科技,爆发!有项关键技术中国已领先世界
- 暖日科技盈如|这到底是为什么?,俄罗斯华人给出劝告:最好别跟俄罗斯女孩结婚
- 周到|民警利用无人机指挥事故车辆立即撤离 “科技赋能”破解交通管理难题
- 概念股|中国股市:量子科技概念股一览 (名单)
- 十倍股|A股最全大科技股名单,今年主线,稳赚不赔!
- 互联网全球最有价值100个科技品牌排行榜:华为、微信与QQ位列前十
- 新华网|南水北调:科技保驾“南水”安全北流
- 挖贝网|利息支出减少,长信科技2020年前三季度净利7.97亿增长11.89%
- 雷科技音画水准爆表!OPPO两大新品发布:加速布局智能IoT