首页 / 行业
DeepMind把GAN又玩出了新花样!推出的是双视频判别器GAN
2019-07-27 07:37:00
DeepMind把GAN又玩出了新花样!这次推出的是双视频判别器GAN,通过对判别器更高效的分解,生成的视频样本在长度和分辨率上都远高于此前最好水平,在多个合成和预测视频数据集上刷新了SOTA。
也许你听说过FaceApp,这是一款利用AI来改变自拍的移动应用程序,你可能也听说过“这些人物都不存在”网站,它可以显示计算机生成的虚构人物照片。但是生成完完全全的新视频的算法你听说过吗?最近,DeepMind的一篇最新论文详细介绍了AI剪辑生成领域的最新进展。
论文地址:
https://arxiv.org/pdf/1907.06571.pdf
研究人员表示,由于“高效计算”组件和技术的使用,再加上新的定制数据集,他们训练出的最佳性能模型:双视频鉴别器GAN(DVD-GAN)可以生成“高保真度”的连贯256 x 256像素视频,帧数高达48帧。
DVD-GAN这个简称由Ian Goodfellow“钦定”
“生成自然视频对于生成建模任务来说是一个明显更困难的挑战,受到数据复杂性和计算要求增加的困扰,”共同作者写道。“出于这个原因,许多关于视频生成的先前研究都围绕着相对简单的数据集或可获得强时间条件信息的任务。我们的研究则关注视频合成和视频预测的任务......并将生成图像模型的成果扩展到视频领域。”
研究人员围绕尖端AI架构构建系统,并专门针对视频进行了特定的调整,使其能够在Kinetics-600上进行训练,这是一个比常用语料库大一个数量级的自然视频数据集。具体来说,研究人员利用扩大的生成对抗网络(GAN),它已应用于多种转换任务,比如将字幕转换为逐个场景的情节板,生成人造星系的图像等。本文中采用的是BigGAN,以大批量和数百万个参数而著称。
DVD-GAN:双判别器,非约束数据集无需担心过拟合
一组4秒合成视频剪辑,由Kinetics-600在128×128帧上训练
DVD-GAN包含两个判别器:一个空间判别器,通过随机采样全分辨率帧并单独处理,来评判单帧的内容和结构,还有一个是时间判别器,负责提供学习信号来生成运动。此外还有一个单独的模块:变换器,让学习到的信息在整个AI模型中传播。
至于训练数据集(Kinetics-600),这是根据最初为人类行为识别策划的500,000个10秒高分辨率YouTube剪辑编制的,研究人员称该数据集具有“多样化”和“非受限”的特点,他们声称这些特征消除了过拟合的风险。(在机器学习中,过拟合是指与特定数据集过于紧密对应的模型,因此无法可靠地预测未来的观测结果。)
该团队在论文中表示,在经过Google加速的第三代TPU训练12到96小时后,DVD-GAN成功创建了包括目标结构、移动,甚至是复杂纹理的视频。模型还尽力在更高的分辨率下创建连贯的物体,物体的运动组成像素更多。但研究人员指出,在UCF-101(13,320个人类行为视频的较小数据集)上评估时,DVD-GAN生成的样本的最好成绩分数为32.97。
“我们希望进一步强调在大型复杂视频数据集(如Kinetics-600)上训练生成模型的好处,”论文中写道。“我们想通过DVD-GAN在此数据集上建立的强大基线标准,作为生成建模社区的参考标杆。虽然在非约束的环境下,要想始终如一地生成逼真的视频还有很多工作要做,但我们相信,DVD-GAN是朝这个方向迈出的坚实一步。”
最新内容
手机 |
相关内容
逆变器技术对新能源汽车市场增长的
逆变器技术对新能源汽车市场增长的重要性,市场,新能源汽车,逆变器,控制,高效率,能和,随着全球对环境保护和可持续发展的关注不断增从概念到生产的自动驾驶软件在环(Si
从概念到生产的自动驾驶软件在环(SiL)测试解决方案,测试,解决方案,自动驾驶,传感器,评估,车辆,自动驾驶软件在环(SiL)测试是一种在计算深度详解一体成型贴片电感在电路中
深度详解一体成型贴片电感在电路中应用的特点,详解,结构,噪声,芯片,稳定性,精度,体成型贴片电感(Molded Chip Inductor)是一种常见的2023 年 3 季度了 DigiKey 新增 4
2023 年 3 季度了 DigiKey 新增 4 万多种现货零件,多种,零件,现货,季度,产品,原厂,全球领先的供应品类丰富、发货快速的商业现货技光耦仿真器简介和优势
光耦仿真器简介和优势,仿真器,参数,接收器,设计方案,耦合,器件,光耦仿真器是一种用于模拟光耦合器件的工具,它可以帮助工程师在设计芯片迈向系统化时代:EDA软件的创新
芯片迈向系统化时代:EDA软件的创新之路,时代,芯片,形式,支持,性能,验证,芯片设计是现代科技领域的重要组成部分,它涉及到电子设计自动清华大学研发光电融合芯片,算力超商
清华大学研发光电融合芯片,算力超商用芯片三千余倍,芯片,研发,商用,测试,计算,科学研究,近日,清华大学发布了一项重要科研成果,他们成聊聊芯片中的负压产生机理及其应用
聊聊芯片中的负压产生机理及其应用,芯片,细胞,用于,测量,生物,结构,芯片中的负压是指在芯片内部产生的负压环境。在某些应用中,负压