不会PS没关系，AI拼图技术已能以假乱真|世界看热讯

发布时间:2023-03-29 11:34:20 来源：量子位

本文经AI新媒体量子位（公众号ID:QbitAI）授权转载，转载请联系出处。

(资料图片仅供参考)

这是一份看似平平无奇的日式便当。

但你敢信，其实每一格食物都是P上去的，而且原图还是酱婶儿的：

△直接抠图贴上去，效果一眼假

背后操作者并不是什么PS大佬，而是一只AI，名字很直白：拼图扩散（Collage Diffusion）。

随便找几张小图拿给它，AI就能自己看懂图片内容，再把各元素非常自然地拼成一张大图——完全不存在一眼假。

其效果惊艳了不少网友。

甚至还有PS爱好者直呼道：

这简直是个天赐之物……希望很快能在Automatic1111（ Stable Diffusion用户常用的网络UI，也有集成在PS中的插件版）中看到它。

为什么效果这么自然？

实际上，此AI生成的“日式便当”还有好几个生成版本——都很自然有木有。

至于为啥还有多种版本？问就是因为用户还能自定义，在总体不变得太离谱的前提下，他们可以微调各种细节。

除了“日式便当”，它还有不少出色的作品。

比如，这是拿给AI的素材，P图痕迹明显：

这是AI拼好的图，反正我愣是没看出什么P图痕迹：

话说这两年，“文字生成图像的扩散模型”着实大火了一把，DALL·E 2和Imagen都是基于此开发出来的应用。这种扩散模型的优点，是生成图片多样化、质量较高。

不过，文字终究对于目标图像，最多只能起到模糊的规范作用，所以用户通常要花大量时间调整提示（prompt），还得搭配上额外的控制组件，才可以取得不错的效果。

就拿前文展示的日式便当来说：

如果用户只输入“一个装有米饭、毛豆、生姜和寿司的便当盒”，那就既没描述哪种食物放到哪一格，也没有说明每种食物的外观。但如果非要讲清楚的话，用户恐怕得写一篇小作文了……

鉴于此，斯坦福团队决定从别的角度出发。

他们决定参考传统思路，通过拼图来生成最终图像，并由此开发出了一种新的扩散模型。

有意思的是，说白了，这种模型也算是用经典技术“拼”出来的。

首先是分层：使用基于图层的图像编辑UI，将源图像分解成一个个RGBA图层（R、G、B分别代表红、绿、蓝，A代表透明度），然后将这些图层排列在画布上，并把每个图层和文字提示配对。

通过分层，可以修改图像中的各种元素。

到目前为止，分层已经是计算机图形领域中一项成熟的技术，不过此前分层信息一般是作为单张图片输出结果使用的。

而在这种新型“拼图扩散模型”中，分层信息成了后续操作的输入。

除了分层，还搭配了现有的基于扩散的图像协调技术，提升图像视觉质量。

总而言之，该算法不仅限制了对象的某些属性（如视觉特征）的变化，同时允许属性（方向、光照、透视、遮挡）发生改变。

——从而平衡了还原度和自然度之间的关系，生成“神似”且毫无违和感的图片。

操作过程也很easy，在交互编辑模式下，用户在几分钟内就能创作一幅拼贴画。

他们不仅可以自定义场景中的空间排列顺序（就是把从别处扣出来的图放到适当的位置）；还能调整生成图像的各个组件。用同样的源图，可以得出不同的效果。

△最右列是这个AI的输出结果

而在非交互式模式下（即用户不拼图，直接把一堆小图丢给AI），AI也能根据拿到的小图，自动拼出一张效果自然的大图。

研究团队

最后，来说说背后的研究团队，他们是斯坦福大学计算机科学系的一群师生。

论文一作，Vishnu Sarukkai现为斯坦福计算机科学系研究生，还是硕博连读的那种。

他的主要研究方向为：计算机图形学、计算机视觉和机器学习。

此外，论文的共同作者Linden Li，也是斯坦福计算机科学系研究生。

在校求学期间，他曾到英伟达实习4个月，与英伟达深度学习研究小组合作，参与训练了增加100M+参数的视觉转换器模型。

论文地址：https://arxiv.org/abs/2303.00262

不会PS没关系，AI拼图技术已能以假乱真|世界看热讯

不会PS没关系，AI拼图技术已能以假乱真|世界看热讯

男子醉卧地上民警“家长式”劝导

环球速读：2023微信公开课PRO·微信之约直播开讲 助力生态产品数字融合发展

安哥拉总统视察中企承建的罗安达新机场项目 全球速看料

每日焦点！上海能源：3月28日融资净买入241.05万元，连续3日累计净买入1979.26万元

林云什么时候踏入渡劫_林云渡劫成功成为大帝

全球资讯：明星qq号大全杨幂-明星qq号大全要真的

德玛西亚之力是什么意思_德玛西亚之力神装_焦点简讯

漫步者：2022年净利同比降21.87% 拟10派2元

民和股份2022年亏损4.52亿同比由盈转亏董事长孙宪法薪酬80.05万|天天快播

牛肉丸的种类有哪些? 2023牛肉丸市场发展现状分析

营造诚实守信风尚！信阳市召开2022年下半年诚信建设“红黑榜”新闻发布会 环球短讯

电动车3年亏60亿美元，福特：明年肯定赚钱

当日快讯：2020年报存虚假记载，ST华英及时任董事长等遭深交所公开谴责

今日讯！金价继续跌！2023年3月28日各大金店黄金价格多少钱一克？

环球精选！正在公示！商洛18家企业拟入选省级创新型中小企业名单

一个面饼的热量_一个面饼的热量是多少呢

美国纳什维尔市大规模校园枪击案后 拜登下令降半旗致哀|世界讯息

世界讯息：玩cf总是出现out of memory怎么解决

天天快看：小鸡宝宝考考你三过家门而不入的历史典故是谁的故事 支付宝蚂蚁庄园小课堂2019年8月26日答案

本田真不是好惹的！这车比途达抢眼，不足15万日产内心焦急 焦点资讯

天天观热点：“国培计划（2022）”中小学文化教育指导校长高级研修班省外集中研修在苏州开班

当日快讯：华宇软件：旗下法律科技产品将通过百度智能云接入文心一言的能力 全球报资讯

茅台五粮液背后的男人再迎IPO！3年赚27亿，一半拿去打广告-每日资讯

生益电子：2022年实现净利润约3.13亿元 同比增长18.4%

天天动态:福州地铁4号线空载试运行 为省内首条全自动运行线路

支付宝的相互宝怎么解除_支付宝的相互宝合法吗

【独家焦点】天津集中科技、人才和创新优势 打造“东疆之星”高成长基地

世界热资讯！东方证券给予朗新科技买入评级，电力能源消费领域领先企业，能源数字化和能源互联网双轮驱动

焦点关注：心脏血管堵塞有什么症状表现_心脏血管堵塞能活多久

英雄联盟手游4.1版本各路上分英雄推荐

宣传夸张、产品同质 企业内卷争夺“宝宝的第一口奶酪”_动态

海南五指山养老靠谱吗？山水兰庭VS滨江度假城哪个适合老年人居住？

【机构调研记录】东方基金调研华帝股份、安道麦A

魅族手机怎么刷机解锁教程_魅族手机怎么刷机解锁_环球滚动

上海7号线首末车时间表最新（上海7号线首末车时间）_当前信息

英汉使役动词研究_关于英汉使役动词研究的简介

股票配债是买还是卖（股票配债怎么交易）

科普短文，DVI接口定义，详细图文资料

每日讯息!金边白菜是哪个地方的菜

难求一胜！国足不敌新西兰，赛后名记怒斥：有些球员不用征召

宇建国贸城二手房好还是新房好？海口二手房涨值空间解读~|全球热消息

武汉地铁在建13条，力争2030年底轨道交通运营里程达到850公里 今日热文

权志龙拜托了冰箱第几期 热闻

拥抱中国发展实现合作共赢

强势是什么表现在哪里_强势是什么意思

奥特莱斯武汉盘龙城_奥特莱斯武汉

焦点热文：经线的长度是什么

天天视讯！胡鑫溢：3.25黄金下周行情走势分析，看震荡运行谨慎追涨

热头条丨心为你而动，情只为你独钟，最真的爱，给最爱的你

高曙光现任老婆多大-目前高曙光现任老婆是谁 当前简讯

今头条！桂林多地下冰雹！未来还有中雨、局部大雨到暴雨

万宝龙钢笔什么档次_全球今日讯

天天热消息：华南等地仍需警惕强对流天气 周日北方开启回暖模式

山西省浑源县发布暴雪蓝色预警

潮牌品牌大全及介绍_潮牌品牌大全 微头条

【公告精选】昆仑万维本周涨近50%，称目前AIGC、人工智能等业务尚未产生实际收入 全球今头条

穿越搞笑文

上市框架进一步扩大！港交所推特专科技公司上市新规，市值门槛降低 全球热文

【全球快播报】九号公司(689009.SH)：Zhong Tou YuanQuan拟减持存托凭证合计不超2.24%

TikTok周受资发内部信：听证会澄清空间不多，程序将会搭建防火墙|全球热消息

博迁新材：公司未在硅谷银行开立存款账户

紫锦社区开展“学习二十大 我来做宣讲”系列主题宣讲活动_今日最新

360安全防护中心无法开启 全球快消息

苏州发力新能源产业创新集群：到2025年产值超4000亿 天天看热讯

全球讯息：大方县八堡乡：开展集镇环境卫生整治文明实践行动

2023珠海香洲区殡葬服务设施联系电话

世界观焦点：第二届寻找“最美家乡河”活动揭晓

环球今日讯！“生物融合”装置有助恢复瘫痪肢体功能

当前播报:武汉三镇捡到宝了：韦世豪国足再次爆发，3镜头不输归化！

【快播报】墙纸的十大品牌都有哪些

苍梧县气象台发布雷电黄色预警信号【III级/较重】【2023-03-24】

世界时讯：2020—2023年：从“新”出发，未来已来

2023中国海归创业大赛在京启动 每日短讯

晚松长19_对于晚松长19简单介绍

环球观速讯丨热评丨想方“设法”服务“自己人”

狙击手幽灵战士3最低配置

洛邑是现在的哪个市_洛邑是现在的哪个城市呀? 环球时讯

3月23日主力动向揭秘——明日预测-今日热讯

环球速读：2023微信公开课PRO·微信之约直播开讲助力生态产品数字融合发展

安哥拉总统视察中企承建的罗安达新机场项目全球速看料

营造诚实守信风尚！信阳市召开2022年下半年诚信建设“红黑榜”新闻发布会环球短讯

美国纳什维尔市大规模校园枪击案后拜登下令降半旗致哀|世界讯息

天天快看：小鸡宝宝考考你三过家门而不入的历史典故是谁的故事支付宝蚂蚁庄园小课堂2019年8月26日答案

本田真不是好惹的！这车比途达抢眼，不足15万日产内心焦急焦点资讯

当日快讯：华宇软件：旗下法律科技产品将通过百度智能云接入文心一言的能力全球报资讯

生益电子：2022年实现净利润约3.13亿元同比增长18.4%

天天动态:福州地铁4号线空载试运行为省内首条全自动运行线路

【独家焦点】天津集中科技、人才和创新优势打造“东疆之星”高成长基地

宣传夸张、产品同质企业内卷争夺“宝宝的第一口奶酪”_动态

武汉地铁在建13条，力争2030年底轨道交通运营里程达到850公里今日热文

权志龙拜托了冰箱第几期热闻

高曙光现任老婆多大-目前高曙光现任老婆是谁当前简讯

天天热消息：华南等地仍需警惕强对流天气周日北方开启回暖模式

潮牌品牌大全及介绍_潮牌品牌大全微头条

【公告精选】昆仑万维本周涨近50%，称目前AIGC、人工智能等业务尚未产生实际收入全球今头条

上市框架进一步扩大！港交所推特专科技公司上市新规，市值门槛降低全球热文

紫锦社区开展“学习二十大我来做宣讲”系列主题宣讲活动_今日最新

360安全防护中心无法开启全球快消息

苏州发力新能源产业创新集群：到2025年产值超4000亿天天看热讯

2023中国海归创业大赛在京启动每日短讯

姐弟恋动漫解说_姐弟恋动漫全球头条

“山海之盟”双向奔赴连江县委书记率队赴蒲城“走亲戚”

保护野生动物守护多样之美热点在线

德琪医药-B股价活跃临近尾盘升近7%-即时看

沃特股份（002886）3月20日主力资金净卖出2351.76万元焦点热门

你再给我顶一句立马让你走详细内容

专业知识技能的获取途径主要是_专业知识技能当前动态

全球观焦点：“挑战杯”中国大学生创业计划竞赛决赛举行元宇宙空间亮点纷呈

钢材下游周报：重点城市房地产销售热度降温，乘用车零售下滑环球实时

“三月学雷锋我们在行动”志愿服务走进曲靖民村小学

宜都一中录取分数线2022年_宜都一中录取分数线天天动态

防患未然怀化市市场监管局主动排查3•15晚会曝光问题相关领域_当前速递

从月薪过万到不足5000元，快递小哥正加速逃离环球聚焦

外地烤肉店老板“吐槽”成都人：什么都要说“谢谢”，受不了了！当前信息

护心托里散环球观焦点