文章图片
文章图片
文章图片
文章图片
文章图片
文章图片
文章图片
文章图片
事情是这样的 。
前不久谷歌不是出了个AI创作神器Imagen嘛 。
只要你给一句话 , 它就能生成符合语意的图片 。
然后脑洞大开的国外网友们 , 不按套路地给Imagen出了道题:
Imagen也没在怕的 , “啪的一下”就给出了一幅力作——《虎戴VR》 。
给宋代的东方老虎佩戴VR 。
还别说 , 这幅《虎戴VR》还真是有点那味了 。
不仅是画风上 , VR头戴跟老虎以及整幅画作能够保持一致 。
就连手柄、双虎嬉戏的感觉也都一步到位地画了出来 。
然后还有两只老虎戴VR , 手牵着手一起“恰恰恰”的:
甚至Imagen还别出心裁地设计了个“连线”版VR(可能在面对面看片吧):
但毕竟在AI作画这事上 , 除了谷歌Imagen之外还有很多神器 。
于是 , 一场《虎戴VR》作画大战就此拉开序幕 。
(猜猜谁家的画更有“心有猛虎 , 细嗅蔷薇”的味道
)
DALL-E也来请战【VR|宋朝名画“虎戴VR”,在外网火了 ?】首先来应战的 , 定然是OpenAI家的DALL·E 。
网友Jacob出于好奇 , 便用它做了几幅来做比较 。
首先是满满“定妆照”风格的《虎戴VR》(很飒啊):
不难看出 , DALL·E的画作和Imagen在风格上还是有很大的区别 。
Imagen的画作更趋于简约线条风 , 而DALL·E则更多了些许油画的元素 。
不过在意境方面 , DALL·E也是能够产出“双虎嬉戏” , 甚至是拟人的画作:
二者相比之下 , 网友们给出了他们的评价:
大多数网友们对谷歌家的Imagen更买单 。
而除了它俩之外 , 像AI绘画神器MidJourney也参与到了此次“大战” 。
不过它的作品 , 就显得略有些诡异了……
DALL·E VS Imagen那么 , 同样作为AI创作神器 , 最近大火的Imagen和DALL·E为何画风会截然不同呢?
Open AI的DALL·E和谷歌的Imagen , 都可以直接通过文本描述生成类似超现实主义的图像 , 让机器也能拥有设计师般的创造力 。
不过 , 二者的“创作”原理大相径庭 。
DALL·E 2采用CLIP将文本特征映射到图像特征 , 然后指导一个GAN或扩散模型生成图像 。
所谓CLIP , 是一个在各种图像和文本上训练的神经网络 , 对生成的多张图片进行排序 , 挑选出更好的生成结果进行展示 。
而谷歌的Imagen则使用纯语言模型只负责编码文本特征 , 把文本到图像转换的工作丢给了图像生成模型 。
语言模型部分使用的是谷歌自己的T5-XXL编码器 , 将训练好的文本冻结 。
图像生成部分则是一系列扩散模型 , 先生成低分辨率图像 , 再逐级超采样 。
谷歌的T5-XXL有46亿个参数 , 而扩大文本编码器的规模 , 可以有效改善文本到图像的对应关系 , 和图像的保真度 。
此外 , Imagen还使用了另一种称为noise conditioning augmentation的扩散技术 , 帮助模型学习已添加的噪声量 , 从而提高图像的还原性 。
对比来看 , Imagen似乎比DALL·E更具有“写实”的特点:
目前 , 在Imagen官网上已涌现出各种新奇的图像 。
- 摩托罗拉|发布十个月下跌1600元,12GB+256GB,柔性屏旗舰再次“5折”出售
- 中国移动|中国移动这次痛下“血本”,为挽留用户,10年网龄便可享3大特权
- 红米手机|说实话,我“馋”红米RedmiNote11SE已经很久了
- 曲面屏|3款“直面屏手机”天花板,性能强悍,使用流畅,关键还能再用5年
- 抖音|“不送外卖不跑腿,下班时间靠刷手机,我实现了财务自由”
- vivo|OPPOReno8Pro和vivoS15Pro“大比拼”,蓝绿厂将一分高下!
- 小米科技|618“最值得买”手机排名,小米第2,iQOO第3,榜首意料之中
- 经典|酷派新品卖点曝光,“90+2”搭配90Hz高刷被赞高品质良心机
- iPad Pro|看过这场“传家”发布会,你就能读懂魅族19
- 法治日报|国务院联席办部署开展“拔钉”行动 缉捕电信网诈头目骨干人员