首页 / 行业
渲染结果与原始图像匹配 视觉系统精准地提取场景参数
2019-05-21 09:01:00
近几年,可嵌入到神经网络架构中的新型可微图形层开始兴起。从空间变换器到可微图形渲染器,这些新型网络层利用多年积累的计算机视觉和图形学研究知识来构建更高效的新型网络架构。通过将几何先验和约束显式建模到神经网络中,我们为能够高效稳健地以自监督方式(这点更为重要)接受训练的架构打开了大门。
总体来看,计算机图形管道需要 3D 物体及其在场景中的绝对位置、对物体材质的描述、光和摄像头。然后,渲染器会解译该场景描述,进而生成合成渲染。
与之相比,计算机视觉系统会从图像入手,试图推断场景的参数。这可以实现对场景中的物体,以及对其材质、三维位置和方向的预测。
训练能够解决这些复杂 3D 视觉任务的机器学习系统通常需要大量数据。由于标记数据是一个成本高昂且复杂的过程,所以我们必须配备设计机器学习模型的机制,以设计出既能理解三维世界,又在训练时无需太多监督的机器学习模型。通过将计算机视觉和计算机图形学技术相结合,我们可以随时利用大量无标记数据,这是绝无仅有的好机会。举例而言,下图所示的流程可以通过合成分析实现,即视觉系统提取场景函数,然后图形系统根据这些函数返回渲染后的图像。如果渲染结果与原始图像匹配,则说明视觉系统精准地提取了场景参数。在该设置中,计算机视觉和计算机图形学携手合作,形成了一个类似自编码器的机器学习系统,该系统能够以自监督方式进行训练。
可微图形层
接下来,我们将探索 TensorFlow Graphics 的一些可用功能。本次探索之旅并未涵盖所有内容;如需更多信息,请访问我们的GitHub,探索 TensorFlow Graphics 推出的新功能。
变换
物体变换可控制物体的空间位置。如下图所示,利用轴线角形式旋转立方体。旋转轴指向上方,旋转方向为逆时针,因此立方体以逆时针方向旋转。在此Colab 示例中,我们展示了如何在神经网络中训练旋转形式,该神经网络在经过训练后用于预测观测物体的旋转和平移。这项任务是很多应用的核心,包括专注于与所处环境进行交互的机器人。在这些场景中,用机械臂(例如,通过其手柄)抓取物体需要精确估测这些物体相对于机械臂的位置。
对摄像头进行建模
摄像头模型在计算机视觉领域占据至关重要的地位,因为其对三维物体投影到图像平面的外观影响极大。如下图所示,此立方体似乎正在放大和缩小,但事实上这只是焦距改变带来的变化。
材质
材质模型定义光线与物体的交互过程,从而赋予物体独特的外观。例如,某些材质(如石膏)会均匀地向各个方向反射光线,而镜面等其他材质只会产生镜面反射。在此交互式Colab 笔记本中,您将了解如何使用 Tensorflow Graphics 生成以下渲染。您还将有机会试验材质和光线的参数,充分了解其交互过程。准确预测材质属性是许多任务的基础。例如,它可以让用户在所处环境中放置虚拟家具,打造室内环境与家具搭配的逼真场景,使用户能够准确感知这件家具的外观。
几何学 — 3D 卷积和池化
近年来,以点云或网格形式输出三维数据的传感器正在逐渐融入我们的日常生活,包括智能手机深度传感器、自动驾驶汽车雷达等等。由于其结构不规则,在这些表征上执行卷积要比在规则网格结构上困难得多。TensorFlow Graphics 提供两个 3D 卷积层和一个 3D 池化层,方便开展训练,例如训练网络在网格上执行对语义部分的分类(如下图所示)
TensorBoard 3D
可视化调试是评估实验是否按正确方向开展的重要方法。为此,TensorFlow Graphics 配备了 TensorBoard 插件,支持以交互方式显示 3D 网格和点云。
最新内容
手机 |
相关内容
高精度3D视觉技术,助力工业机器人实
高精度3D视觉技术,助力工业机器人实现汽车零部件高效上下料,工业机器人,助力,视觉,高精度,3D,算法,高精度3D视觉技术在工业机器人上创建更低延迟和更高效率的 5G 系统
创建更低延迟和更高效率的 5G 系统,延迟,系统,5G,优化,方法,网络架构,随着技术的不断发展,人们对通信系统的需求也在不断增加。5G技嵌入式视觉技术如何赋予机器观察能
嵌入式视觉技术如何赋予机器观察能力,能力,视觉,嵌入式,跟踪,特征,计算,嵌入式视觉技术是一种将人的视觉能力赋予机器的技术。通过机器人自动上下料,工业智能化进程的
机器人自动上下料,工业智能化进程的重要里程碑,进程,里程碑,自动,错误,危险,安全性,机器人自动上下料是工业智能化进程的重要里程碑,Prophesee全球最小基于事件的视觉
Prophesee全球最小基于事件的视觉传感器,瞄准超低功耗边缘智能设备,边缘,功耗,视觉,传感器,事件,适合,Prophesee是一家位于法国的人从零基础开始,掌握低代码+ Al 的应
从零基础开始,掌握低代码+ Al 的应用技巧,零基础,方法,框架,工具,深度学习,学习,低代码(Low-Code)是一种通过可视化开发工具和少量手写智能时代的三大核心技术
智能时代的三大核心技术,时代,核心技术,智能,机器学习,数据,学习,智能时代是指在人工智能技术的推动下,人类社会进入了一个智能化的英伟达携手联发科打造CPU,威胁英特
英伟达携手联发科打造CPU,威胁英特尔主导地位,英特尔,威胁,英伟达,能和,公司,产品,英伟达(NVIDIA)和联发科(MediaTek)的合作计划已经引起