英伟达、UC伯克利联合研究：条件GAN高分辨率图像合成与语义编辑p 这一研究拓宽了图像合成的领域

本文《英伟达、UC伯克利联合研究：条件GAN高分辨率图像合成与语义编辑pix2pixHD（论文+代码）》是傻大方资讯网小编整理于开放的互联网，版权归原作者所有。

新智元AI World 2017世界人工智能大会开场视频

中国人工智能资讯智库社交主平台新智元主办的 AI WORLD 2017 世界人工智能大会11月8日在北京国家会议中心举行，大会以“AI 新万象，中国智能+”为主题，上百位AI领袖作了覆盖技术、学术和产业最前沿的报告和讨论，2000多名业内人士参会。新智元创始人兼CEO杨静在会上发布全球首个AI专家互动资讯平台“新智元V享圈”。

全程回顾新智元AI World 2017世界人工智能大会盛况：

新华网图文回顾

http://www.xinhuanet.com/money/jrzb20171108/index.htm

爱奇艺

上午：http://www.iqiyi.com/v_19rrdp002w.html

下午：http://www.iqiyi.com/v_19rrdozo4c.html

阿里云云栖社区

http://yq.aliyun.com/webinar/play/316?spm=5176.8067841.wnnow.14.ZrBcrm

新智元编译

来源：arxiv.org

编译：马文

【新智元导读】英伟达和UC Berkeley的研究者最近公开一个名为pix2pixHD的项目，并公开了论文和代码。pix2pixHD能够利用条件GAN进行2048x1024分辨率的图像合成和处理，输入语义标注图生成接近真实的现实世界图像，例如街景图、人脸图像等，并且只需简单的操作即可修改和搭配图像，效果优于pix2pix和CRN等先前的方法。

英伟达和UC Berkeley的研究者最近公开一个名为pix2pixHD的“用条件GAN进行2048x1024分辨率的图像合成和处理”项目，并公开了论文和代码。pix2pixHD能够利用语义标注图还原接近真实的现实世界图像，例如街景图、人脸图像等，并且只需简单的操作即可修改和搭配图像。

图：上方是输入的语义地图，下方是pix2pixHD合成图像

作者发布的视频介绍中，可以看到，你可以选择更换街景中车辆的颜色和型号，给街景图增加一些树木，或者改变街道类型（例如将水泥路变成十字路）。类似地，利用语义标注图合成人脸时，给定语义标注的人脸图像，你可以选择组合人的五官，调整大小肤色，添加胡子等。

图：左下角是人脸的语义标注图，pix2pixHD合成各种不同五官、接近真实的人脸图像。

视频介绍：

论文：<strong>High-Resolution Image Synthesis and Semantic Manipulation with Conditional GANs</strong></p><p style = "font-size:18px">作者：Ting-Chun Wang1, Ming-Yu Liu1, Jun-Yan Zhu2, Andrew Tao1, Jan Kautz1, Bryan Catanzaro1</p><p style = "font-size:18px">1NVIDIA Corporation  2UC Berkeley</p><p style = "font-size:18px"><strong>摘要</strong></p><p style = "font-size:18px">本文提出了一种利用条件生成对抗网络（conditional GANs）来合成高分辨率、照片级真实的图像的新方法。条件GAN已经实现了各种各样的应用，但是结果往往是低分辨率的，而且也缺乏真实感。在这项工作中，我们的方法生成了2048x1024分辨率的视觉上非常棒的效果，利用新的对抗损失，以及新的多尺度生成器和判别器架构。此外，我们还将我们的框架扩展到具有两个附加特征的交互式可视化操作。首先，我们合并了对象实例分割信息，这些信息支持对象操作，例如删除/添加某个对象或更改对象类别。其次，我们提出了一种方法，可以在给定相同输入条件下生成不同的结果，允许用户交互式地编辑对象的外观。人类意见研究（human opinion study）表明，我们的方法显著优于现有的方法，既提高了图像的质量，也提高了图像合成和编辑的分辨率。</p><p style = "font-size:18px"><img alt="英伟达、UC伯克利联合研究：条件GAN高分辨率图像合成与语义编辑p" onload="javascript:ImgReSize(this)" class="imgcenter" src="http://img5.shadafang.com/img.php?http://mmbiz.qpic.cn/mmbiz_png/UicQ7HgWiaUb3iahw0cFp4qKsYSb59ohppBcGGcIicd2DTcf7JeYQwxFbiaYEjQLJqo7oOvNsDrfF7gVIveUFC82w4w/0?wx_fmt=png" /><br /></p><p style = "font-size:18px">图1：我们提出了一个利用语义标注图（上图（a）的左下角）合成2048×1024分辨率图像的生成对抗框架。与以前的工作相比，我们的结果表现出更自然的纹理和细节。（b）我们可以在原始标签地图上改变标签来创建新的场景，例如用建筑物替换树木。（c）我们的框架还允许用户编辑场景中单个对象的外观，例如改变汽车的颜色或道路的纹理。请访问网站进行更多的对比和交互式编辑演示。</p><p style = "font-size:18px"><img alt="英伟达、UC伯克利联合研究：条件GAN高分辨率图像合成与语义编辑p" onload="javascript:ImgReSize(this)" class="imgcenter" src="http://img5.shadafang.com/img.php?http://mmbiz.qpic.cn/mmbiz_png/UicQ7HgWiaUb3iahw0cFp4qKsYSb59ohppBNGT58zYjibbZZ5MTN1QmMwPvsNGJRyHUdMoQaiaJQw5I8iceUc6hZMQnw/0?wx_fmt=png" /><br /></p><p style = "font-size:18px">图2：生成器的网络架构。我们首先在较低分辨率的图像上训练一个残差网络G?。然后，将另一个残差网络G?附加到G?，然后两个网络在高分辨率图像上进行联合训练。具体来说，G?中的残差块的输入是来自G?的特征映射和来自G?的最后一个特征映射的元素和。</p><p style = "font-size:18px"><img alt="英伟达、UC伯克利联合研究：条件GAN高分辨率图像合成与语义编辑p" onload="javascript:ImgReSize(this)" class="imgcenter" src="http://img5.shadafang.com/img.php?http://mmbiz.qpic.cn/mmbiz_png/UicQ7HgWiaUb3iahw0cFp4qKsYSb59ohppBwbC7J8egkh9Ju6pRF60R34us1jY8IgLibOscQobJ10tCtLbvW6oyjnw/0?wx_fmt=png" /><br /></p><p style = "font-size:18px">图3：使用实例图（instance map）：（a）一个典型的语义标签图。请注意，所有汽车都有相同的标签，这使得它们很难区分开来。（b）提取的实例边界图。有了这些信息，更容易区分不同的对象。</p><p style = "font-size:18px"><img alt="英伟达、UC伯克利联合研究：条件GAN高分辨率图像合成与语义编辑p" onload="javascript:ImgReSize(this)" class="imgcenter" src="http://img5.shadafang.com/img.php?http://mmbiz.qpic.cn/mmbiz_png/UicQ7HgWiaUb3iahw0cFp4qKsYSb59ohppBohwv5JyPfeHB8QLEs2RlnnHFpkctMSVrQmsMlW0qHsibmT9AZdcYDag/0?wx_fmt=png" /><br /></p><p style = "font-size:18px">图4：没有实例映射（instance map）和带有实例映射的结果之间的比较。可以看出，当添加实例边界信息时，相邻车辆的边界更加清晰。</p><p style = "font-size:18px"><img alt="英伟达、UC伯克利联合研究：条件GAN高分辨率图像合成与语义编辑p" onload="javascript:ImgReSize(this)" class="imgcenter" src="http://img5.shadafang.com/img.php?http://mmbiz.qpic.cn/mmbiz_png/UicQ7HgWiaUb3iahw0cFp4qKsYSb59ohppB8JpT96AmibMicxWnIwToBjqiboiaQPbXoh9WLSicib8M9BxnNDzMbyhzYkYA/0?wx_fmt=png" /><br /></p><p style = "font-size:18px">图5：除了用于生成图像的标签之外，还使用 instance-wise特征。</p>结果<br /><br /><p style = "font-size:18px"><img alt="英伟达、UC伯克利联合研究：条件GAN高分辨率图像合成与语义编辑p" onload="javascript:ImgReSize(this)" class="imgcenter" src="http://img5.shadafang.com/img.php?http://mmbiz.qpic.cn/mmbiz_png/UicQ7HgWiaUb3iahw0cFp4qKsYSb59ohppBdzAhiaRGiaH1qexVF7XtngTer7AENU0fNu5UG4hEtMLibxtbaQicOic0jag/0?wx_fmt=png" /><br /></p><p style = "font-size:18px">表1：Cityscapes 数据集上不同方法得出的结果的语义分割得分。我们的结果大大优于其他方法，并且非常接近原始图像的准确率（即Oracle）。</p><p style = "font-size:18px"><img alt="英伟达、UC伯克利联合研究：条件GAN高分辨率图像合成与语义编辑p" onload="javascript:ImgReSize(this)" class="imgcenter" src="http://img5.shadafang.com/img.php?http://mmbiz.qpic.cn/mmbiz_png/UicQ7HgWiaUb3iahw0cFp4qKsYSb59ohppBhq1JZ1Rnn6Qz7vDIDDdnrw5ZSia4icrYshU7xIo4cMSe58wsxC6CyhPw/0?wx_fmt=png" /><br /></p><p style = "font-size:18px">图7：在Cityscapes数据集上的比较（语义标注图显示在（a）的左下角）。对于有VGG损失和没有VGG损失，我们的结果比其他两种方法更接近真实。可以放大图片查看更多细节。</p><p style = "font-size:18px"><img alt="英伟达、UC伯克利联合研究：条件GAN高分辨率图像合成与语义编辑p" onload="javascript:ImgReSize(this)" class="imgcenter" src="http://img5.shadafang.com/img.php?http://mmbiz.qpic.cn/mmbiz_png/UicQ7HgWiaUb3iahw0cFp4qKsYSb59ohppBibdujQjVPAkPr0Sxb7hpuEqLqcVjaQbj6xXs3DciaOJOJ0Ofm4ydlu1g/0?wx_fmt=png" /><br /></p><p style = "font-size:18px">图8：在NYU数据集上的比较。我们的方法比其他方法生成的图像更加逼真、色彩更丰富。</p>讨论和结论<br /><br /><p style = "font-size:18px">本研究的结果表明，条件GAN（conditional GAN）能够合成高分辨率、照片级逼真的图像，而不需要任何手工损失或预训练的网络。我们已经观察到，引入perceptual loss可以稍微改善结果。我们的方法可以实现许多应用，并且可能对需要高分辨率结果，但是预训练的网络不可用的领域有潜在的用处，例如医学成像和生物学领域。</p><p style = "font-size:18px">本研究还表明，可以扩展图像-图像的合成流程以产生不同的输出，并且在给定适当的训练输入 - 输出对（例如本例中的实例图）的情况下实现交互式图像处理。我们的模型从未被告知什么是“纹理”，但能学习将不同的对象风格化，这也可以推广到其他数据集（即，使用一个数据集中的纹理来合成另一个数据集中的图像）。我们相信这些贡献拓宽了图像合成的领域，并可以应用于许多其他相关的研究领域。</p><p style = "font-size:18px"><strong>论文：http://arxiv.org/pdf/1711.11585.pdf</strong></p><p style = "font-size:18px"><strong>代码：http://github.com/NVIDIA/pix2pixHD</strong></p><p style = "font-size:18px"><strong>欢迎读者朋友加入新智元读者群一起交流探讨，请加微信（备注名字+学校/企业+研究/关注领域）：aiera2015</strong></p><p style = "font-size:18px"><strong>备注（名字+<strong>学校/企业+</strong>视觉），加入计算机视觉讨论群。</strong></p><p style = "font-size:18px"><img alt="英伟达、UC伯克利联合研究：条件GAN高分辨率图像合成与语义编辑p" onload="javascript:ImgReSize(this)" class="imgcenter" src="http://img5.shadafang.com/img.php?http://mmbiz.qpic.cn/mmbiz_jpg/UicQ7HgWiaUb20RYibUic6Q6EI7IykbFsvNdCbzhzXd2B1Ar27iagtpXjbzgGybmvtaZwBibkXhskTSvX2v4QHciaTNGg/0?wx_fmt=jpeg" /><br /></p> </p> <div class="dede_pages"><ul></ul></div> <div class="pcd_ad"> <div style=margin-top:10px;> <center> <script type="text/javascript" src="//bd100.shadafang.com/production/k_fe/openjs/ce_lx_gc.js"></script> <script type="text/javascript" src="//bd100.shadafang.com/common/gb_a_ya/static/h_tck.js"></script> <script type="text/javascript" src="//bd100.shadafang.com/production/h/common/c/static/bzbi_u/openjs/dr.js"></script> </center></div> <div style=margin-top:10px;> <center> </center> </div> </div> <div class="mbd_ad"> <script type="text/javascript" src="//bd100.shadafang.com/production/y/common/tp_lc/openjs/iz/static/vl.js"></script> <script type="text/javascript" src="//bd100.shadafang.com/common/i/static/dc/resource/acjve/v.js"></script> </div> <br /> <p><br /><ul class="post-loop post-loop-list cols-4"><li><a href="/c/tj121BcS12017.html" title="联合国译员之路有多远，张光波老师讲座来袭！" target="_blank">联合国译员之路有多远，张光波老师讲座来袭！ </a></li> <li><a href="/c/tj121BcEH017.html" title="四川大学华西第二医院设多学科联合会诊(MDT)门诊" target="_blank">四川大学华西第二医院设多学科联合会诊(MDT)门诊 </a></li> <li><a href="/c/tj1215ESC2017.html" title="伯克利人工智能研究院最新研究：协作型工业机器人如何更智能？" target="_blank">伯克利人工智能研究院最新研究：协作型工业机器人如何更智能？ </a></li> <li><a href="/c/tj1215EP3H017.html" title="赛事网联合福建教育电视台打造精品少儿春晚！录制【倒计时25天】" target="_blank">赛事网联合福建教育电视台打造精品少儿春晚！录制【倒计时25天】 </a></li> <li><a href="/c/tj1215EO032017.html" title="河北发生矿难致4死1伤被瞒报当地成立联合调查组" target="_blank">河北发生矿难致4死1伤被瞒报当地成立联合调查组 </a></li> <li><a href="/c/tj1215EN132017.html" title="山西对33家安全生产失信企业实施联合惩戒" target="_blank">山西对33家安全生产失信企业实施联合惩戒 </a></li> <li><a href="/c/tj1215EJ962017.html" title="防城港钦州联合开展打击非法采选矿专项行动(图)" target="_blank">防城港钦州联合开展打击非法采选矿专项行动(图) </a></li> <li><a href="/c/tj1215E61032017.html" title="安理会再次延长联合国南苏丹特派团任期" target="_blank">安理会再次延长联合国南苏丹特派团任期 </a></li> <li><a href="/c/tj1215E5cH017.html" title="趁老板出差不在联合外人偷公司" target="_blank">趁老板出差不在联合外人偷公司 </a></li> <li><a href="/c/tj1215E5a52017.html" title="冬季，读本温暖的好书 ▏ 文艺联合书单第12期" target="_blank">冬季，读本温暖的好书 ▏ 文艺联合书单第12期 </a></li> </ul></p> <div class=entry-copyright> <p></p> </div> </div> <div class="entry-footer"> <div class="prev-next sb br mb clearfix"> <p class="post-prev fl ellipsis">上一篇：<a href='/c/tj1204BC642017.html'>挖机人最爱的礼物是什么？快看看你能领到什么！</a> </p> <p class="post-next fr ellipsis">下一篇：<a href='/c/tj1204BCB2017.html'>中国医生在飞机上用导尿术救人获众人好评</a> </p> </div> </div> </div> </article> </main> <aside class="sidebar"> <div class="widget widget_post_thumb"> <h3 class="widget-title"><span>更多...</span></h3> <ul> <li class="item"> <div class="item-img"> <a class="item-img-inner" href="/c/tj111V213192017.html" title="想戒烟？最关键的一点出乎意料！"> <img width="480" height="300" class="attachment-default size-default wp-post-image j-lazy" alt="想戒烟？最关键的一点出乎意料！" src="/images/defaultpic.gif"> </a></div> <div class="item-content"> <p class="item-title"><a href="/c/tj111V213192017.html" title="想戒烟？最关键的一点出乎意料！">想戒烟？最关键的一点出乎意料！</a></p> </div> </li> <li class="item"> <div class="item-img"> <a class="item-img-inner" href="/c/tj111L204632017.html" title="一张纸测你离脑梗有多远？"> <img width="480" height="300" class="attachment-default size-default wp-post-image j-lazy" alt="一张纸测你离脑梗有多远？" src="/images/defaultpic.gif"> </a></div> <div class="item-content"> <p class="item-title"><a href="/c/tj111L204632017.html" title="一张纸测你离脑梗有多远？">一张纸测你离脑梗有多远？</a></p> </div> </li> <li class="item"> <div class="item-img"> <a class="item-img-inner" href="/c/tj1111603aH017.html" title="冬季中药养生配方"> <img width="480" height="300" class="attachment-default size-default wp-post-image j-lazy" alt="冬季中药养生配方" src="/images/defaultpic.gif"> </a></div> <div class="item-content"> <p class="item-title"><a href="/c/tj1111603aH017.html" title="冬季中药养生配方">冬季中药养生配方</a></p> </div> </li> <li class="item"> <div class="item-img"> <a class="item-img-inner" href="/c/tj1201B02212017.html" title="广西百年壮寨约1/5毁于火海无人员伤亡"> <img width="480" height="300" class="attachment-default size-default wp-post-image j-lazy" alt="广西百年壮寨约1/5毁于火海无人员伤亡" src="/images/defaultpic.gif"> </a></div> <div class="item-content"> <p class="item-title"><a href="/c/tj1201B02212017.html" title="广西百年壮寨约1/5毁于火海无人员伤亡">广西百年壮寨约1/5毁于火海无人员伤亡</a></p> </div> </li> <li class="item"> <div class="item-img"> <a class="item-img-inner" href="/c/tj120LL4352017.html" title="存款翻倍的秘密，往下看一看您就懂......."> <img width="480" height="300" class="attachment-default size-default wp-post-image j-lazy" alt="存款翻倍的秘密，往下看一看您就懂......." src="/images/defaultpic.gif"> </a></div> <div class="item-content"> <p class="item-title"><a href="/c/tj120LL4352017.html" title="存款翻倍的秘密，往下看一看您就懂.......">存款翻倍的秘密，往下看一看您就懂.......</a></p> </div> </li> <li class="item"> <div class="item-img"> <a class="item-img-inner" href="/c/tj101554J262017.html" title="一对夫妻离婚,男的说:你不过是我用车子房子换来的女人!女的却说"> <img width="480" height="300" class="attachment-default size-default wp-post-image j-lazy" alt="一对夫妻离婚,男的说:你不过是我用车子房子换来的女人!女的却说" src="/images/defaultpic.gif"> </a></div> <div class="item-content"> <p class="item-title"><a href="/c/tj101554J262017.html" title="一对夫妻离婚,男的说:你不过是我用车子房子换来的女人!女的却说">一对夫妻离婚,男的说:你不过是我用车子房子换来的女人!女的却说</a></p> </div> </li> <li class="item"> <div class="item-img"> <a class="item-img-inner" href="/c/tj100552552H017.html" title="秒杀瑞士军刀，这个享誉世界的国产神器，走到哪都能用上！"> <img width="480" height="300" class="attachment-default size-default wp-post-image j-lazy" alt="秒杀瑞士军刀，这个享誉世界的国产神器，走到哪都能用上！" src="/images/defaultpic.gif"> </a></div> <div class="item-content"> <p class="item-title"><a href="/c/tj100552552H017.html" title="秒杀瑞士军刀，这个享誉世界的国产神器，走到哪都能用上！">秒杀瑞士军刀，这个享誉世界的国产神器，走到哪都能用上！</a></p> </div> </li> <li class="item"> <div class="item-img"> <a class="item-img-inner" href="/c/tj092A006152017.html" title="注意了!赣州独生子女可能无法继承父母房产?好多人不知道!"> <img width="480" height="300" class="attachment-default size-default wp-post-image j-lazy" alt="注意了!赣州独生子女可能无法继承父母房产?好多人不知道!" src="/images/defaultpic.gif"> </a></div> <div class="item-content"> <p class="item-title"><a href="/c/tj092A006152017.html" title="注意了!赣州独生子女可能无法继承父母房产?好多人不知道!">注意了!赣州独生子女可能无法继承父母房产?好多人不知道!</a></p> </div> </li> <li class="item"> <div class="item-img"> <a class="item-img-inner" href="/c/tj112B451402017.html" title="其貌不扬还屡次劈腿，李丽珍到底看上他哪点了？"> <img width="480" height="300" class="attachment-default size-default wp-post-image j-lazy" alt="其貌不扬还屡次劈腿，李丽珍到底看上他哪点了？" src="/images/defaultpic.gif"> </a></div> <div class="item-content"> <p class="item-title"><a href="/c/tj112B451402017.html" title="其貌不扬还屡次劈腿，李丽珍到底看上他哪点了？">其貌不扬还屡次劈腿，李丽珍到底看上他哪点了？</a></p> </div> </li> <li class="item"> <div class="item-img"> <a class="item-img-inner" href="/c/tj11095960202017.html" title="2018年放假时间表公布！除夕的前一天竟然是…看哭了..."> <img width="480" height="300" class="attachment-default size-default wp-post-image j-lazy" alt="2018年放假时间表公布！除夕的前一天竟然是…看哭了..." src="/images/defaultpic.gif"> </a></div> <div class="item-content"> <p class="item-title"><a href="/c/tj11095960202017.html" title="2018年放假时间表公布！除夕的前一天竟然是…看哭了...">2018年放假时间表公布！除夕的前一天竟然是…看哭了...</a></p> </div> </li> </ul> </div> <script async src="https://pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script>  <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-0446337276450554" data-ad-slot="9969035691" data-ad-format="auto" data-full-width-responsive="true"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script> <div style=margin-top:10px;><center> <script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script>  <ins class="adsbygoogle" style="display:block" data-ad-client="ca-pub-0446337276450554" data-ad-slot="9374620940" data-ad-format="auto"></ins> <script> (adsbygoogle = window.adsbygoogle || []).push({}); </script></center> </div> </aside> </div> </div> <footer class="footer"> <div class="container"> <div class="clearfix"> <div class="footer-col footer-col-logo"> </div> <div class="footer-col footer-col-copy"> <ul class="footer-nav hidden-xs"> <li class="menu-item menu-item-706"><a href="/shenghuo/">生活</a></li> <li class="menu-item menu-item-706"><a href="/renwen/">人文</a></li> <li class="menu-item menu-item-706"><a href="/xuexi/">学习</a></li> <li class="menu-item menu-item-706"><a href="/tuijian/">推荐</a></li> <li class="menu-item menu-item-706"><a href="/yuedu/">悦读</a></li> <li class="menu-item menu-item-706"><a href="/renwen/kk/">看看</a></li> </ul> <div class="copyright"> <p>Copyright © 2017-2022 傻大方 <a href="http://beian.miit.gov.cn/" target="_blank" rel="nofollow">京ICP备14049044号-8</a> </p> </div> </div> <div class="footer-col footer-col-sns"> <div class="footer-sns"> </div> </div> </div> </div> </footer> <div class="action action-style-0 action-color-0 action-pos-1" style="bottom:15%;"> <div class="action-item gotop j-top"> <i class="web-icon wi action-item-icon"><svg aria-hidden="true"> <use xlink:href="#wi-arrow-up-2"></use> </svg></i></div> </div> <script> var _hmt = _hmt || []; (function() { var hm = document.createElement("script"); hm.src = "https://hm.baidu.com/hm.js?81ee5b4bf062f52ad4637e2509846f6f"; var s = document.getElementsByTagName("script")[0]; s.parentNode.insertBefore(hm, s); })(); </script> </div> <script>var _web_js={};</script> <script src="/skin/new/js/index.js"></script> </body> </html>