山水画|GAN模型生成山水画,骗过半数观察者,普林斯顿大学本科生出品


山水画|GAN模型生成山水画,骗过半数观察者,普林斯顿大学本科生出品
文章插图
作者 | 高卫华
近年来,基于生成对抗网络GAN模型,图像生成领域实现了许多有趣的应用,尤其是在绘画创作方面。
山水画|GAN模型生成山水画,骗过半数观察者,普林斯顿大学本科生出品】英伟达曾在2019年提出一款名叫GauGAN的神经网络作图工具,可以利用GAN将语意分割图转换为逼真的图像,即使不擅长作画的用户,也能有机会享受到作画的乐趣,将粗糙的涂鸦变成照片级的写实作品。通过100 万张图片的训练结果,该工具的神经网络技术能够根据对真实图像的了解,填充所有细节和纹理,以及反射、阴影和颜色,自动生成写实的美丽风景图。
此外,MIT和IBM沃森联合实验室也曾联合发布一个在线工具AI PortraitsArs,该工具可利用AI将用户上传的照片变成文艺复兴时期的大师画作,一度成为热门网站,其数据库涵盖从伦勃朗、提香再到梵高等著名艺术家的艺术绘画风格。并且,其研究人员表示,AI Portraits Ars并不是单纯的转换风格,而是由模型自己决定肖像的样式,完全重新设计照片中的面部线条。
肖像画方面,在CVPR2019上,清华大学计算机系的刘永进教授课题组提出了一个层次化的GAN模型APDrawingGAN,可将人脸照片转化为高质量的艺术肖像线条画。
大多数GAN研究都集中在西方艺术上,目前我们已经看到不少AI生成写实主义、后现代,甚至是抽象主义的作品,而很少能看到AI在传统东方艺术上的表现。传统东方艺术同样拥有悠久的历史和深刻的文化意义,在美学上也与西方艺术一样值得深入研究。
近日,一位普林斯顿大学的本科学生Alice Xue将目光投向了中国山水画,在毕业论文中开发了一款名为SAPGAN(Sketch-And-Paint GAN)的AI模型,该模型可以“从无到有”生成高质量的中国山水画。
山水画|GAN模型生成山水画,骗过半数观察者,普林斯顿大学本科生出品
文章插图
(a)由人类艺术家创建的中国山水画;
(b)基线模型(顶部绘画来自RaLSGAN,底部绘画来自StyleGAN2 );
(c)和(d)通过提出的Sketch-And-Paint框架,结合RaLSGAN和StyleGAN2绘制
实现过程
传统中国山水画在绘制过程中,一般有勾、皴、点、染等步骤,顾名思义,就是先勾画出大致轮廓,再进行渲染。而AIice提出的端到端生成中国山水画无条件输入模型,遵循的也是这个步骤。
为了实现这一过程,AIice构建了两个模型:Stage I: SketchGAN ;Stage II: PaintGAN。SketchGAN是从样本图像中采集高分辨率的边缘图,而PaintGAN是根据SketchGAN进行“翻译”创作,从而生成一幅完整的山水画。
山水画|GAN模型生成山水画,骗过半数观察者,普林斯顿大学本科生出品
文章插图
训练数据集
SAPGAN模型是基于一个新的中国传统山水画数据集上训练的,这一数据集不是来自百度或者谷歌,而是由作者本人收集画作并建立的。
AIice表示,目前的山水画数据集存在不唯一性和图像质量及数量不足的问题。为了促进该领域的更多研究发展,Alice建立了一个涵盖2192幅高质量中国传统山水画的新数据集,并在GitHub上发布了这一数据集,供公众研究使用。
数据集中的山水画来自史密森尼弗里尔美术馆、大都会艺术博物馆、普林斯顿大学美术馆和哈佛大学美术馆等开放式博物馆画廊,Alice还手动过滤掉了非景观艺术品,并手工裁剪调整其大小,以进行模型训练。
真实性测试
论文中提到,为验证SAPGAN创作画作的真实性,进行了一项有242名参与者的视觉图灵测试,而测试结果出乎意料。
山水画|GAN模型生成山水画,骗过半数观察者,普林斯顿大学本科生出品
文章插图
SAPGAN创作出的画作被误认为人类艺术品的频率高达55%,而基线GAN模型创作的画作仅以11%的频率出现。在美学品质方面,SAPGAN模型在所有艺术类别中的评分也始终高于基线GAN模型。
测试人员中,有29位是中国人,其余都是以英语为母语的外国人。然而,比较其测试结果得出,华语应试者判断画作来源的准确率明显低于讲英语的应试者,说汉语的参与者平均得分为49.2%,明显低于说英语参与者的73.5%。也就是说,说中文的人70%的时候还会把SAPGAN的画误认为是人,而整体水平是55%。
显然,无论是否熟悉中国文化,参与者都难以区分画作的来源,由此也可见SAPGAN模型所生成画作的真实感。
更令人惊讶的是,在做这项研究之前,Alice从未上过机器学习课程,作为一个新手,她反而找到了更有趣的角度去处理问题,得出这样一项创新研究成果。