7 Papers|谷歌等用神经网络给照片打光,沈向洋等神经语言处理综述( 三 )


摘要:近年来 , 生成式对抗网络(generative adversarial nets, GAN)迅速发展 , 已经成为当前机器学习领域的主要研究方向之一 。 GAN 来源于零和博弈的思想, 其生成器和鉴别器对抗学习 , 获取给定样本的数据分布, 生成新的样本数据 。 对 GAN 模型在图片生成、异常样本检测和定位、文字生成图片以及图片超分辨率等多方面进行了大量的调查研究 , 并在这些 GAN 的应用所取得的实质性进展进行了系统的阐述 。 对 GAN 的提出背景与研究意义、理论模型与改进结构 , 以及其主要应用领域进行了总结 。 通过对 GAN 在各方面的应用分析 , 对 GAN 的不足以及未来发展方向进行综述 。
推荐:这篇论文的作者分别来自沈阳理工大学和沈阳师范大学 。
论文 7:Improving Monocular Depth Estimation by Leveraging Structural Awareness and Complementary Datasets
作者:Tian Chen、Shijie An、Yuan Zhang 等
链接:https://arxiv.org/pdf/2007.11256.pdf
摘要:深度是实现 3D 场景理解的重要信息 , 快手 Y-tech 利用自研的单目深度估计技术获得了高质量的深度信息 , 并将模型部署到移动端 , 结合 Y-tech 已有的多项技术研发了 3DPhoto、混合现实等多种新玩法 。 这些黑科技玩法不限机型 , 可让用户在手机上无门槛的实时体验 , 给用户带来全新的视觉体验和交互方式的同时 , 可帮助用户更好的进行创作 。
这项研究主要探究了如何更好的利用三维空间的结构性信息提升单目深度估计精度 , 此外还针对复杂场景构建了一个新的深度数据集 HC Depth , 包含六种挑战性场景 , 有针对性地提升模型的精度和泛化性 。
7 Papers|谷歌等用神经网络给照片打光,沈向洋等神经语言处理综述
本文插图
网络模型结构 。
7 Papers|谷歌等用神经网络给照片打光,沈向洋等神经语言处理综述
本文插图
空间注意力机制模块的可视化 。
7 Papers|谷歌等用神经网络给照片打光,沈向洋等神经语言处理综述
本文插图
在 NYUv2 数据集上的可视化实验对比 。
推荐:该论文已被 ECCV 2020 收录 , 论文代码和模型即将在 GitHub 上开源 , 作者也将在 8 月 23-28 日的 ECCV 大会线上展示他们的工作 。
ArXiv Weekly Radiostation
机器之心联合由楚航、罗若天发起的ArXiv Weekly Radiostation , 在 7 Papers 的基础上 , 精选本周更多重要论文 , 包括NLP、CV、ML领域各10篇精选 , 并提供音频形式的论文摘要简介 , 详情如下:
本周 10 篇 NLP 精选论文是:
1. ConvBERT: Improving BERT with Span-based Dynamic Convolution. (from Shuicheng Yan)
2. Antibody Watch: Text Mining Antibody Specificity from the Literature. (from Maryann E. Martone)
3. Efficient MDI Adaptation for n-gram Language Models. (from Dan Povey, Sanjeev Khudanpur)
4. Taking Notes on the Fly Helps BERT Pre-training. (from Tie-Yan Liu)
5. Word meaning in minds and machines. (from Gregory L. Murphy)
6. Domain-Specific Language Model Pretraining for Biomedical Natural Language Processing. (from Jianfeng Gao)
7. Trove: Ontology-driven weak supervision for medical entity classification. (from Nigam H. Shah)
8. Evaluating Automatically Generated Phoneme Captions for Images. (from Mark Hasegawa-Johnson)
9. Generalized Word Shift Graphs: A Method for Visualizing and Explaining Pairwise Comparisons Between Texts. (from Peter Sheridan Dodds)