世超|编段话就能变出一张图片,英伟达不卖显卡改卖艺了?
在这篇文章的开头,世超先来给大家看一张图片。
文章插图
还有这张。
文章插图
以及这张。
文章插图
当然,给大家看这几张风景照是有原因的,因为这些图片完全由 AI 技术生成,是假的。。。
其实世超已经对各种 AI 技术快要听腻了,但是这个自动生成图片的技术确实能让人眼前一亮。
这些图片不仅看上去跟真的照片一样,而且是根据你的想法进行创作的。
只要你在上面随便画两笔,而就是这再简单不过的几笔,AI 就可以在你极其简单的创作基础上添加 “ 亿点点 ” 细节。。。
文章插图
简直离天下之大谱。。。
而这个黑科技一般的玩意儿,出自我们熟悉的英伟达之手,这是一个叫做 PoE GAN 的 AI 技术。
这里的 PoE 指的是 Product of Experts,专家乘积,而 GAN 就是生成对抗网络的意思。
是不是听不懂?没关系我也听不懂。。。
但大家不需要知道具体的意思,只要知道 PoE GAN 是一种究极缝合怪,它既能识别出你的灵魂绘画,也能根据文字输入生成画面。
只要在上面随便画两笔,它就会立刻响应并生成对应的画面。
文章插图
你加多少,它就生成多少,分毫不差。
无论怎么群魔乱舞,AI 都能从容不迫地应对过来。
文章插图
你也不用去管里面的细节,AI 会自动识别不同的区域,比如波浪形状的就是山峰,图片顶部就是天空等等。
要是你不喜欢现在的样子,还可以改变地形和天气,想要啥样的都能给你整出来。
你还可以直接敲字,AI 就会实时分析出来再把文字转化成图像。
比如打出山峰被雪覆盖,画面就会从山峰变成覆盖了积雪的山。
文章插图
或者打出沙滩,画面会立刻出现对应的景象。
文章插图
但是你后面接着打出多云,天空就会跟着发生变化。
文章插图
世超第一次看确实觉得很惊喜,但是看多了这种演示,难免也会对这项技术产生一些疑问。
比如,PoE GAN 是不是只是单纯地把已经学习到的素材进行拼接,才产生出了这些图片?
还真不是这样,PoE GAN 不止会把大片的树木、山脉、天空和海洋拼接在一起,还会按照你画出来的细节进行填充。
比如演示中画出来的一小块谜之物体就会被 AI 识别出来,并生成了海洋中的一块石头。
文章插图
不仅识别成功,画面中的细节也遵循了现实生活的逻辑,比如石头周围就会有海浪产生,海水也是白色的。
这个细节,有点东西。
不过为了能够对这玩意儿了解更深一点,世超还是去网上查到了英伟达官方的资料和说明,想看看具体的解释。
目前现有的图像合成框架里,遇到单一类型的需求是没问题的,但要是各种不同的需求一起上,那 AI 就当场懵逼了。。。
【 世超|编段话就能变出一张图片,英伟达不卖显卡改卖艺了?】而 PoE GAN 的诞生就是为了解决这一限制,它可以识别不同的输入,并把它们混合在一起。
比如这里有一个非常直观的例子,当你只选择简笔画的时候,画面会按照目前的需求生成一幅图像。
文章插图
这时我再加上不同的颜色和文字,把不同的区域分隔开来,画面就会按照需求变成另外一副模样。
文章插图
而当把详细的文字描述也勾选上,此时图像就会在按照要求已经生成的图像基础上,进一步满足人们苛刻的要求。
文章插图
PoE GAN 确实很神奇,但这项技术也不是最近才出现的,英伟达在 2019 年就搞出来了一个 AI 技术,叫做 GauGAN。
- 接待员|天天科普反诈骗的我,居然被三句话骗了300块
- 快递|产品经理研究技术(讲人话):网络七层结构
- 卢伟冰|第五纵队又沸腾了,卢伟冰又说了什么大实话?
- 探路|对话新石器创始人余恩源:三年后无人配送的成本将会低于人力成本|探路2022
- 自媒体|避开这2个误区,日收益300都不在话下,新手做自媒体须知
- 智能手表|佳明Venu2 Plus智能手表上手评测:可以打电话的智能手表
- 特斯拉|缴税创历史新高!马斯克喊话美国官方:不表示一下?
- 合伙人|对话投资人,医疗赛道的下一个10年机会在哪里?
- 手机|工信部发话,手机预装软件必须可卸载!实测有预装多达56个
- iPhone|用实力说话的轻薄本——realme Book增强版