据外媒报道,苹果公司(Apple)的工程师团队开发出基于人工智能(AI)的模型Depth Pro,可以绘制2D深度图像。相关论文发表于arXiv预印本服务器,并描述了这款应用及其功能。
图片来源:苹果
人类和其他动物之所以能够感知深度,是因为大脑能够拍摄两张图像,每只眼睛一张,并利用它们之间的差异来确定图像中哪些部分更近,哪些部分更远。一些摄像头也做了类似的操作来制作3D视频。
由于智能手机仅依靠一个摄像头来拍照和制作视频,因此它们具有各种硬件和软件附加功能,可以增加一定程度的深度。在这项新尝试中,苹果工程师使用原始图像中的数据创建了整个深度图,而无需使用摄像头内在参数等元数据。
深度图是使用原始图像中的所有像素创建的地图。地图上的每个数据点代表一个像素,对应于像素所代表的图片部分与被成像物体的相应部分之间的距离。
这样的地图可以为平面图片添加另一个维度,使其具有3D效果。该团队表示,创建深度图可以比使用标准智能手机技术生成的3D效果更清晰。
苹果团队在声明中声称,使用该模型的应用程序在配备标准GPU的计算机上运行时,只需0.3秒即可生成深度图,而且无需生成3D效果通常所需的摄像头数据类型。
通过创建如此快速运行的模型,苹果开启了实时使用单镜头摄像头创建3D图像的大门。该团队指出,这可能会对机器人和其他实时地图绘制应用(例如自动驾驶汽车上使用的应用)产生重大影响。