从视频片段中推断楼层平面图 新AI研究令人大开眼界

人工智能 机器学习
1月11日消息,据外媒报道,近日,来自Facebook、德克萨斯大学奥斯汀分校和卡内基梅隆大学的研究人员正在探索一种人工智能技术,利用视觉和音频,从一个短视频剪辑中重建一个平面图。

平面布置图对于可视化空间、规划路线和沟通建筑设计非常有用。例如,一个进入新建筑的机器人可以使用平面图快速感知总体布局。创建平面图通常需要一个完整的布局,这样3D传感器和摄像机就可以捕捉到整个空间。

1月11日消息,据外媒报道,近日,来自Facebook、德克萨斯大学奥斯汀分校和卡内基梅隆大学的研究人员正在探索一种人工智能技术,利用视觉和音频,从一个短视频剪辑中重建一个平面图。

[[375129]]

研究人员断言,音频提供了空间和语义信号,补充了图像的映射能力。他们说,这是因为声音天生是由物体的几何形状所驱动的。声音从表面反射回来,揭示了房间的形状,远远超出了相机的视野。从远处听到的声音,甚至是多个房间之外的声音,可以揭示自由空间的存在,声音物体可能存在。此外,从不同方向听到的声音暴露了基于这些声音所代表的活动或事物的布局。例如,淋浴的声音可能暗示着浴室的方向,而微波炉的声音则暗示着厨房的方向。

研究人员的方法被称为AV-Map,旨在将带有多通道音频的短视频转换成2D楼层平面图。机器学习模型利用音频和视觉数据序列来推理楼层平面图的结构和语义,最终使用解码组件融合音频和视频信息。AV-Map生成的平面图大大超出了视频中直接可见的区域,显示了划分为离散语义房间标签(如家庭房间和厨房)的自由空间和被占用区域。

该团队在来自Matternet3D和SoundSpaces数据集的数字环境中试验了两种设置,即主动和被动。在第一个实验中,使用一个虚拟摄像机在模型房屋的房间内移动时发出一种已知的声音。在第二种情况下,只依赖家中物体或人自然发出的声音。

研究人员表示,在未来的工作中,将计划考虑扩展多层平面图,并将绘图想法与机器人连接起来,主动控制摄像头。

 

责任编辑:姜华 来源: 比特网
相关推荐

2018-02-25 08:48:50

百度职业代码

2014-04-01 11:39:38

集装箱数据中心谷歌

2020-04-06 09:21:04

AI医疗汽车行业

2009-05-19 10:18:00

机房网络管理

2010-12-20 13:53:10

GoogleWebGL

2021-01-10 08:16:25

微信移动应用实用技巧

2011-04-13 14:52:13

Qcon

2021-04-03 13:12:43

微信技巧Bug

2020-09-17 20:25:00

人工智能

2024-01-15 07:00:00

2021-12-28 11:06:22

Python 开发编程语言

2021-12-23 20:00:59

Firefox浏览器开源

2015-05-12 10:34:45

2021-12-20 10:32:05

IT技术领导者CIO

2018-08-15 17:16:57

海信

2018-11-23 14:30:19

人工智能人脸识别刷手掌

2018-09-05 13:14:54

MySQLInnoDBMyISAM

2018-04-25 10:46:05

Linux命令行日历

2015-04-23 10:35:47

iPhone 6 技术

2015-04-23 10:55:49

iPhone 6Force Touch
点赞
收藏

51CTO技术栈公众号