AmodalSynthDrive:一个用于自动驾驶的合成非模态感知数据集
创始人
2025-07-03 13:30:40
0

本文经自动驾驶之心公众号授权转载,转载请联系出处。

图片

  • 论文链接:https://arxiv.org/pdf/2309.06547.pdf
  • 数据集链接:http://amodalsynthdrive.cs.uni-freiburg.de

摘要

本文介绍了AmodalSynthDrive:一个用于自动驾驶的合成非模态感知数据集。与人类不同,即使在部分遮挡的情况下,人类也可以毫不费力地估计物体的整体,而现代计算机视觉算法仍然发现这一方面极具挑战性。由于缺乏合适的数据集,利用这种非模态感知进行自动驾驶在很大程度上仍未得到开发。这些数据集的生成主要受到昂贵标注成本的影响,以及需要减轻标注者在准确标注遮挡区域的主观性带来的干扰。为了解决这些限制,本文引入了AmodalSynthDrive,这是一种合成的多任务非模态感知数据集。该数据集提供了150个驾驶序列的多视图相机图像、3D边界框、激光雷达数据和里程计,其包括了在各种交通、天气和光照条件下超过1M的目标标注。AmodalSynthDrive支持多种非模态场景理解任务,包括引入的非模态深度估计用于增强空间理解。本文为每项任务评估若干基线,以说明挑战并且设置公开基准服务器。

主要贡献

本文的贡献总结如下:

1)本文提出了AmodalSynthDrive数据集,这是一种针对城市驾驶场景的全面合成非模态感知数据集,具有多种数据来源;

2)本文提出了针对非模态感知任务的基准,即非模态语义分割、非模态实例分割和非模态全景分割;

3)新型的非模态深度估计任务旨在促进增强空间理解。本文通过若干基线证明了这项新任务的可行性。

论文图片和表格

图片


图片


图片


图片


图片


图片


图片


图片

总结

感知是自动驾驶汽车的一项关键任务,但是目前的方法仍然缺少对复杂交通场景解释所需的非模态理解。为此,本文提出了AmodalSynthDrive,这是一个用于自动驾驶的多模态合成感知数据集。通过合成的图像和激光雷达点云,我们提供了一个全面的数据集,其包括用于基本非模态感知任务的真值标注数据,同时还引入一种新的任务来增强空间理解,称为非模态深度估计。本文提供了超过60000个单独的图像集,每个图像集与非模态实例分割、非模态语义分割、非模态全景分割、光流、2D&3D边界框、非模态深度以及鸟瞰图相关。通过AmodalSynthDrive,本文提供了各种基线,并且相信这项工作将为动态城市环境的非模态场景理解的新型研究铺平道路。

原文链接:https://mp.weixin.qq.com/s/7cXqFbMoljcs6dQOLU3SAQ

相关内容

热门资讯

如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...
德国电信门户网站可实时显示全球... 德国电信周三推出一个门户网站,直观地实时提供其安装在全球各地的传感器网络检测到的网络攻击状况。该网站...
为啥国人偏爱 Mybatis,... 关于 SQL 和 ORM 的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行...
《非诚勿扰》红人闫凤娇被曝厕所... 【51CTO.com 综合消息360安全专家提醒说,“闫凤娇”、“非诚勿扰”已经被黑客盯上成为了“木...
2012年第四季度互联网状况报... [[71653]]  北京时间4月25日消息,据国外媒体报道,全球知名的云平台公司Akamai Te...