首页动态消费创业汽车商业房产互联网纵横聚焦快讯热点

资讯 > 消费 >

资讯 > 消费 >

GAN卷土重来：10亿参数的GigaGAN效果堪比扩散模型

来源：程序员客栈发布时间：2023-06-16 23:44:47

【资料图】

点蓝色字关注“机器学习算法工程师”

设为星标，干货直达！

自从 DALL·E 2 之后，在图像生成方面扩散模型替代GAN成了主流方向，比如开源的文生图模型stable diffusion也是基于diffusion架构的。近日， Adobe研究者在论文Scaling up GANs for Text-to-Image Synthesis提出了参数量为10亿（1B）的GAN模型：GigaGAN，其在文生图效果上接近扩散模型效果，而且推理速度更快，生成512x512大小图像只需要0.13s，生成16M像素图像只需要 3.66s。同时GigaGAN也支持latent空间的编辑功能，比如latent插值，风格混合，以及向量运算等。

GigaGAN

改进了StyleGAN架构，采用两阶段训练策略：一个是64x64的图像生成器和一个512x512的图像超分2器，其图像生成器架构如下所示（这里也是采用CLIP text encoder来引入text condition）：

GigaGAN

在 LAION2B-en和 COYO-700M数据集上训练，其在COCO数据集上的FID达到9.09，超过stable diffusion 1.5，推理速度比stable diffusion快20倍多（2.9s vs 0.13s）：

GigaGAN

除了文生图能力，还可以实现可控的合成，比如风格混合，如下图所示：

更多效果图和技术细节见论文https://arxiv.org/abs/2303.05511和网站https://mingukkang.github.io/GigaGAN/

关键词：

责任编辑：FG003

上一篇：酷派手机怎么样设置来电铃声_酷派手机怎么样

下一篇：最后一页

频道精选

GAN卷土重来：10亿参数的GigaGAN效果堪比扩散模型2023-06-16 23:44:47
酷派手机怎么样设置来电铃声_酷派手机怎么样2023-06-16 23:42:11
天津市滨海新区首家不动产便民服务中心正式营业2023-06-16 23:41:34
港股异动 | 蔚来-SW(09866)涨超7% ET5旅行版今日开启交付系列有望贡献销量三成2023-06-16 23:58:07
国家级甲醇经济示范区建设进程加速山西晋中甲醇重卡集中签约全球报道2023-06-16 23:38:47

记者：曼联仍对德赫亚续约抱乐观态度2023-06-16 23:34:12
本月千万别忘了这件事！逾期将收滞纳金→ 环球聚焦2023-06-16 23:49:37
佳华科技：公司目前未接大模型，未来是否会接入需根据公司整体发展规划来决定|每日看点2023-06-16 23:40:08
鲍晓：嬉皮笑脸面对人生的难2023-06-16 23:50:47
当前视点！新疆开展“6·16”全国安全宣传咨询日活动2023-06-16 23:42:06

GAN卷土重来：10亿参数的GigaGAN效果堪比扩散模型

GAN卷土重来：10亿参数的GigaGAN效果堪比扩散模型

酷派手机怎么样设置来电铃声_酷派手机怎么样

酷派手机怎么样设置来电铃声_酷派手机怎么样

热门资讯

风投公司Molten Ventures对其在Ledger和Revolut的股份价值进行减记【世界新要闻】麦收进度已过九成！稳产保丰，小麦主产区有这些举措资讯推荐:曹蓟光：5G全连接工厂赋能企业数字化转型普京：俄罗斯2023年4月GDP同比增长3.3%_今日视点老艺术家何庆魁:75岁高龄,被儿子爆料"他嫖不动了,每月1万就够花" 世界报资讯重点聚焦!拓邦股份闪耀亮相德国EES，2023明星展项引领能源新时代当前消息！新华全媒+|抓好关键期各方助力高校毕业生就业林州重机（002535）股东郭现生质押2200万股，占总股本2.74%_世界今日报【速看料】女性成为露营地消费主力

最新资讯

网站首页 | 关于我们 | 免责声明 | 联系我们

所有文章、评论、信息、数据仅供参考，使用前请核实，风险自负。

Copyright 2013-2020 高陵经济网版权所有京ICP备2022016840号-34

联系邮箱：920 891 263@qq.com glxcb.cn All Rights Reserved