首页 / 行业
GANcraft可解决图像到图像转换问题
2022-04-06 16:35:00
NVIDIA 和康奈尔大学的科学家们引入了一种混合的无监督神经渲染管道,以有效地表示体素世界中的大型复杂场景。从本质上讲, 3D 艺术家只需要构建最小值,剩下的部分将由算法来构建照片级真实感世界。研究人员将这种混合神经渲染管道应用于 Minecraft 区块世界,以生成更逼真的 Minecraft 场景。
NVIDIA 和更广泛的研究团体( pix2pix 、 pix2pixHD 、 MUNIT 、 SPADE )以前的工作已经解决了图像到图像转换( im2im )的问题——将图像从一个域转换到另一个域。乍一看,这些方法似乎为将一个世界转换为另一个世界的任务提供了一个简单的解决方案—一次翻译一幅图像。但是, im2im 方法不保持视点一致性,因为它们不了解 3D 几何体,并且每个 2D 帧都是独立生成的。从下面的图像中可以看出,这些方法的结果会产生抖动和突然的颜色和纹理变化。
输入 GANcraft ,这是一种直接在 3D 输入世界上操作的新方法。
研究人员在 study 中解释说:“由于用户创建的块世界根本不存在地面真实照片级真实感渲染,我们必须通过间接监督来训练模型。”。
该方法的工作原理是在输入块世界中随机采样摄影机视图,然后想象该视图的真实照片版本是什么样子。这是在 SPADE 的帮助下完成的,这是 NVIDIA 先前在图像到图像转换方面的工作,也是流行的 GauGAN 演示中的关键组件。 GANcraft 通过使用样式调节网络克服了这些生成的“伪真实”的视图不一致性,该网络可以消除世界结构与渲染样式之间的歧义。这使 GANcraft 能够生成与视图一致的输出视频,并且具有不同的风格。
虽然研究结果在 Minecraft 中得到了验证,但该方法适用于其他 3D 块体世界,如体素。缩短构建高清世界所需的时间和专业知识的潜力增加了这项研究的价值。它可以帮助游戏开发者、 CGI 艺术家和动画产业缩短构建这些巨大而令人印象深刻的世界所需的时间。
GANcraft 是在 Imaginaire 库中实现的。该库针对生成模型和生成对抗网络的训练进行了优化,支持多 GPU 、多节点和自动混合精度训练。 NVIDIA 制作的 10 多种不同研究成果以及预训练模型已经发布。随着时间的推移,此库将继续使用更新的作品进行更新。
关于作者
Nathan Horrocks 是 NVIDIA Research 的内容营销经理。他重点强调了 NVIDIA 实验室在世界各地进行的惊人研究。
审核编辑:郭婷
最新内容
手机 |
相关内容
台积电1.4nm,有了新进展
台积电1.4nm,有了新进展,台积电,行业,需求,竞争力,支持,芯片,近日,台积电(TSMC)宣布将探索1.4纳米技术,这是一项令人振奋的举措,将有望为E芯片迈向系统化时代:EDA软件的创新
芯片迈向系统化时代:EDA软件的创新之路,时代,芯片,形式,支持,性能,验证,芯片设计是现代科技领域的重要组成部分,它涉及到电子设计自动英伟达芯片开发过程引入聊天机器人
英伟达芯片开发过程引入聊天机器人,扩展更多AI应用,聊天机器人,扩展,芯片,英伟达,开发过程,调试,英伟达是一家全球领先的半导体公司,小到一个分子!研究人员开发一种微小
小到一个分子!研究人员开发一种微小的压电电阻器,优化,位置,结构,用于,传感器,压电效应,近年来,随着电子技术的快速发展,对微小尺寸电射频前端芯片GC1103在智能家居无线
射频前端芯片GC1103在智能家居无线通信IoT模块中应用,模块,芯片,无线通信,智能家居,支持,数据交换,射频前端芯片GC1103是一种低功耗面向6G+AI,鹏城云脑的演进
面向6G+AI,鹏城云脑的演进,鹏城,人工智能,数据存储,脑可,智能终端,智能,随着科技的不断进步,人们的生活方式也在不断改变。6G+AI(人工阿里平头哥发布首颗SSD主控芯片:镇
阿里平头哥发布首颗SSD主控芯片:镇岳510,平头,芯片,物联网,性能,阿里巴巴,支持,阿里平头哥是指阿里巴巴集团的CTO张建锋,他在宣布了阿应用在阀门控制中的直流有刷驱动芯
应用在阀门控制中的直流有刷驱动芯片,芯片,控制,支持,远程控制,电动,调节,直流有刷驱动芯片是一种用于控制直流电机的IPB072N15N3G