NVIDIA透过人工智能 将2D平面照片转变为3D立体场景

2022-04-01
关注

当人们在75年前使用宝丽来 (Polaroid ) 相机拍摄出世界上第一张实时成像照片时,便是一项以逼真 2D 影像迅速捕捉 3D 世界画面的创举。时至今日,人工智能 (AI) 研究人员反将此作法倒转过来,亦即在几秒钟内将一组静态影像变成数字 3D 场景。
 

本文引用地址:http://www.eepw.com.cn/article/202203/432690.htm

NVIDIA Research 透过人工智能,在一瞬间将 2D 平面照片变成 3D 立体场景


这项称为逆向渲染 (inverse rendering) 的过程,利用 AI 来预估光线在真实世界中的表现,让研究人员能利用从不同角度拍摄的少量 2D 影像来重建 3D 场景。NVIDIA Research 团队开发出一种方法,几乎能在瞬间内完成这项任务,是同类中首批将超高速神经网络训练与快速渲染相结合的模型之一。
NVIDIA 将该方法应用在一种称为神经辐射场 (Neural Radiance Fields;NeRF) 的热门新技术上,创造出 Instant NeRF 这项当今渲染速度最快的 NeRF 技术,在某些情况下速度可以提升超过 1,000 倍。用数十张静态照片,便能在几秒钟内完成训练模型,再加上拍摄角度的数据,在几十毫秒内即可渲染出生成的 3D 场景。
NVIDIA 绘图研究部门副总裁 David Luebke 表示:「如果说多边形网格这样的传统 3D 表现方式像是向量图形,那么 NeRF 就像是位图,它们会密集捕捉光线从物体或场景中辐射出来的方式。从这个意义上来说,Instant NeRF 对 3D 的重要性,不亚于数字相机和 JPEG 压缩技术对 2D 摄影的重要性,其可大幅提升 3D 捕捉与分享的速度、便利性和范围。」
在 NVIDIA GTC 大会议程中展示的 Instant NeRF,可用于为虚拟世界建立化身或场景、以 3D 方式拍摄视频会议的与会者以及所处环境,或是为 3D 数字地图重建场景。
NVIDIA Research 团队为了向早期的宝丽来照片致敬,重现了安迪.沃荷 (Andy Warhol) 拍摄实时成像照片的经典照片,利用 Instant NeRF 将其转变为 3D 场景。
NeRF是什么?
NeRF 会依照输入的一组 2D 影像,使用神经网络来表现及渲染逼真的 3D 场景。
收集资料再投入 NeRF 的做法,有点类似红毯上的摄影师试着从各个角度拍摄名人身上的华丽服装,而神经网络需要有从场景四周多个位置拍摄的数十张照片,以及每张照片的相机位置等数据支持。
场景里的人或物体若移动,拍摄照片的速度则是愈快愈好。要是在拍摄 2D 影像的过程中,人或物体有过多的移动,AI 便会生成模糊的 3D 场景。
基本上,NeRF 在此时会填补空白处,训练一个小型神经网络,预测从 3D 空间中任何一点朝着任意方向辐射出的光线颜色来重建场景。这项技术甚至能解决当某些照片里的物体被其它照片中的柱子等障碍物遮住时所产生的遮挡问题。
利用 Instant NeRF 将渲染速度提升1,000倍
人类天生就会按照一部分所见画面来估算物体的深度和外观,但这对 AI 来说却是一项高难度的任务。
根据画面的复杂性和分辨率,以传统方法建立一个 3D 场景须花费数小时甚至更长的时间。而利用 AI 则可加快处理速度。早期开发的 NeRF 模型在几分钟内便能渲染出无伪影的清晰场景,但仍需数小时进行训练。
然而,Instant NeRF 却大幅缩短了渲染时间,其以 NVIDIA 所开发出的 Multi-resolution Hash Encoding 技术为基础,而这项经过优化调整的技术可以在 NVIDIA GPU 上高效运行。研究人员透过一种新的输入编码法,可以利用一个高速运行的微型神经网络来创造高质量的结果。
研究人员使用 NVIDIA CUDA 工具套件与 Tiny CUDA 神经网络函式库来开发此模型。这个小巧的神经网络可以在单一 NVIDIA GPU 上进行训练和运行,并在搭载 NVIDIA Tensor 核心的显示适配器上有着最高的运行速度。
这项技术可以用于拍摄实体环境物体的 2D 照片或影片,以训练机器人和自动驾驶车来了解这些物体的大小及形状。建筑业与娱乐产业也能使用这项技术,快速为实体环境建立数字画面,创作者便能用它来进行修改和构建。
除了 NeRF,NVIDIA 的研究人员也在探索如何将这种输入编码技术用于加速处理多项 AI 领域的难题,包括强化学习、语言翻译和通用的深度学习算法。

您觉得本篇内容如何
评分

相关产品

CSMS 中科微感 人工智能+嗅觉传感器(AI-Nose) 气体传感器

中科微感逐步攻克了制约人工嗅觉传感发展的核心材料、硬件、算法等技术,开发出了以新型纳米敏感材料为基础,以微纳加工技术为支撑,以人工智能算法为核心的第一代 MEMS 基金属氧化物半导体原理的人工嗅觉传感器产这一产品将解决当前制约人工智能嗅觉技术与市场应用发展的关键问题:提供量产化的高一致、低成本、微型化的嗅觉传感器阵列硬件,以及提供标准化的人工智能+嗅觉气味感知软件平台,使客户能够快速构建和应用气味数据模型

XKCON 祥控 弹药库环境温湿度异常报警与智能监控系统 温湿度变送器

济南祥控自动化设备有限公司自主研发的XKCON祥控弹药库环境温湿度异常报警与智能监控系统采用物联网、传感器、大数据、人工智能等先进技术,能够对弹药库环境温湿度信息实现数字化、可视化管理。

山东美安 矿山电机车防追尾道岔口报警器 控制器及系统

煤矿用机车防追尾保护装置 机车防追尾保护装置是一种矿用人工智能保护装置、具有防追尾保护、无线触发沿途弯道语言保护、输出控制并记录等功能可广泛的使用在矿山井下、井上的运输机车上。

KEYENCE 基恩士 AI-1000C 图像匹配传感器

因此,人工智能系列能够在模式匹配的基础上对物体进行稳定的检测和识别,而这是基于强度或距离的传感器难以实现的。 基于强度或距离的传感器难以实现。

云传物联 河道水质浮标在线PH监测传感器系统设备 便携式水质检测仪

电子水质监测解决方案利用信息控制与处理、人工智能、自动化、物联网及多媒体等技术,集水质参数在线采集、无线传输、智能处理、超限报警、远程管理等功能于一体的水质监测解决方案

DINSEE 鼎信智慧科技 DX-WPS100-SP2... CMOS图像传感器

针对传统配电线路人工巡检效率低、周期长等问题,鼎信智慧结合物联网、红外热成像、人工智能等技术,研发了配电线路图像视频双光球机在线监测装置。

大立科技 DM60-W3 红外体温快速筛检

红外热成像体温快速筛检系统DM60-W3系列为384*288/640*480像素,人工智能算法,远距离、大场景测温更精准。

Maike 迈科光电 MK-PB4023PS&ALS&VC-A01E 接近传感器

EM30918、STK3311-X、STK3321、APDS-9900 ,9901、TMD2772WA、RPR0521RS、VCNL4035X01 WH4530A),广泛应用于平板电脑、工控显示类产品、智能家居、AI人工智能等场景,联想笔记本电脑,九安医疗的测温仪,微步数码的平板等都应用了我们这颗传感器,已量产批量出货。

Handsome 翰德圣 HDSELM V1.1 安全传感器和系统

设备全生命周期管理平台融合的物联网、云计算、大数据、人工智能、优化制造、再制造六项主流技术,通过云端模块化的架构可为企业灵活管理设备,不仅可以随时随地了解设备运行状态、发现故障隐患,还能够通过大数据分析指导企业维修

评论

您需要登录才可以回复|注册

提交评论

广告

电子产品世界

这家伙很懒,什么描述也没留下

关注

点击进入下一篇

林雪萍|铅华洗尽 工业4.0走进下半场?

提取码
复制提取码
点击跳转至百度网盘