世超|编段话就能变出一张图片,英伟达不卖显卡改卖艺了?

在这篇文章的开头,世超先来给大家看一张图片。
世超|编段话就能变出一张图片,英伟达不卖显卡改卖艺了?
文章插图
还有这张。
世超|编段话就能变出一张图片,英伟达不卖显卡改卖艺了?
文章插图
以及这张。
世超|编段话就能变出一张图片,英伟达不卖显卡改卖艺了?
文章插图
当然,给大家看这几张风景照是有原因的,因为这些图片完全由 AI 技术生成,是假的。。。
其实世超已经对各种 AI 技术快要听腻了,但是这个自动生成图片的技术确实能让人眼前一亮。
这些图片不仅看上去跟真的照片一样,而且是根据你的想法进行创作的。
只要你在上面随便画两笔,而就是这再简单不过的几笔,AI 就可以在你极其简单的创作基础上添加 “ 亿点点 ” 细节。。。
世超|编段话就能变出一张图片,英伟达不卖显卡改卖艺了?
文章插图
简直离天下之大谱。。。
而这个黑科技一般的玩意儿,出自我们熟悉的英伟达之手,这是一个叫做 PoE GAN 的 AI 技术。
这里的 PoE 指的是 Product of Experts,专家乘积,而 GAN 就是生成对抗网络的意思。
是不是听不懂?没关系我也听不懂。。。
但大家不需要知道具体的意思,只要知道 PoE GAN 是一种究极缝合怪,它既能识别出你的灵魂绘画,也能根据文字输入生成画面。
只要在上面随便画两笔,它就会立刻响应并生成对应的画面。
世超|编段话就能变出一张图片,英伟达不卖显卡改卖艺了?
文章插图
你加多少,它就生成多少,分毫不差。
无论怎么群魔乱舞,AI 都能从容不迫地应对过来。
世超|编段话就能变出一张图片,英伟达不卖显卡改卖艺了?
文章插图
你也不用去管里面的细节,AI 会自动识别不同的区域,比如波浪形状的就是山峰,图片顶部就是天空等等。
要是你不喜欢现在的样子,还可以改变地形和天气,想要啥样的都能给你整出来。
你还可以直接敲字,AI 就会实时分析出来再把文字转化成图像。
比如打出山峰被雪覆盖,画面就会从山峰变成覆盖了积雪的山。
世超|编段话就能变出一张图片,英伟达不卖显卡改卖艺了?
文章插图
或者打出沙滩,画面会立刻出现对应的景象。
世超|编段话就能变出一张图片,英伟达不卖显卡改卖艺了?
文章插图
但是你后面接着打出多云,天空就会跟着发生变化。
世超|编段话就能变出一张图片,英伟达不卖显卡改卖艺了?
文章插图
世超第一次看确实觉得很惊喜,但是看多了这种演示,难免也会对这项技术产生一些疑问。
比如,PoE GAN 是不是只是单纯地把已经学习到的素材进行拼接,才产生出了这些图片?
还真不是这样,PoE GAN 不止会把大片的树木、山脉、天空和海洋拼接在一起,还会按照你画出来的细节进行填充。
比如演示中画出来的一小块谜之物体就会被 AI 识别出来,并生成了海洋中的一块石头。
世超|编段话就能变出一张图片,英伟达不卖显卡改卖艺了?
文章插图
不仅识别成功,画面中的细节也遵循了现实生活的逻辑,比如石头周围就会有海浪产生,海水也是白色的。
这个细节,有点东西。
不过为了能够对这玩意儿了解更深一点,世超还是去网上查到了英伟达官方的资料和说明,想看看具体的解释。
目前现有的图像合成框架里,遇到单一类型的需求是没问题的,但要是各种不同的需求一起上,那 AI 就当场懵逼了。。。
世超|编段话就能变出一张图片,英伟达不卖显卡改卖艺了?】而 PoE GAN 的诞生就是为了解决这一限制,它可以识别不同的输入,并把它们混合在一起。
比如这里有一个非常直观的例子,当你只选择简笔画的时候,画面会按照目前的需求生成一幅图像。
世超|编段话就能变出一张图片,英伟达不卖显卡改卖艺了?
文章插图
这时我再加上不同的颜色和文字,把不同的区域分隔开来,画面就会按照需求变成另外一副模样。
世超|编段话就能变出一张图片,英伟达不卖显卡改卖艺了?
文章插图
而当把详细的文字描述也勾选上,此时图像就会在按照要求已经生成的图像基础上,进一步满足人们苛刻的要求。
世超|编段话就能变出一张图片,英伟达不卖显卡改卖艺了?
文章插图
PoE GAN 确实很神奇,但这项技术也不是最近才出现的,英伟达在 2019 年就搞出来了一个 AI 技术,叫做 GauGAN。
世超|编段话就能变出一张图片,英伟达不卖显卡改卖艺了?