摘要准确的定位能力是自动驾驶的基础。传统的视觉定位框架通过几何模型来解决语义地图匹配问题,几何模型依赖于复杂的参数调整,从而阻碍了大规模部署。本文提出了BEV定位器:一种使用多目相机图像的端到端视觉语义定位神经网络。具体地,视觉BEV(鸟瞰图)编码器提取多目图像并将其展平到BEV空间中。而语义地图特征在结构上嵌入为地图查询序列。然后,crossmodeltransformer将BEV特征和语义图查询关联起来。通过交叉注意力模块...
2022-12-15 07:33:52 8145浏览 1点赞 0回复 0收藏
摘要激光雷达产生的点云是大多数最先进的3D目标检测器的主要来源。然而,小的,遥远的,和不完整的稀疏或少数点的物体通常很难被检测到。本文提出了一个新的框架Sparse2Dense,通过学习在潜在空间中对点云进行致密化,从而有效地提高3D检测性能。具体来说,本文首先训练一个以密集点云为输入的密集点三维检测器(DDet),然后设计一个以规则点云为输入的稀疏点三维检测器(SDet)。重要的是,本文在SDet中制定了轻量级的插件式S2D模...
2022-12-14 07:51:28 9059浏览 2点赞 0回复 0收藏
摘要性能和推理速度之间的权衡对于实际应用至关重要。架构重参化获得了更好的权衡,它正在成为现代卷积神经网络中越来越流行的成分。尽管如此,当需要INT8推理时,其量化性能通常太差,无法部署(例如ImageNet上的top1精度下降超过20%)。本文深入探讨了这种失败的潜在机制,其中原始设计不可避免地扩大了量化误差。因此提出了一种简单、鲁棒和有效的补救方法,以具有量化友好的结构,该结构也享有重参化的好处。论文的方法大大...
2022-12-13 08:01:21 7106浏览 2点赞 0回复 0收藏
摘要通用图像分割不是一个新概念。过去几十年中统一图像分割的尝试包括场景解析、全景分割,以及最近的新全景架构。然而,这样的全景架构并没有真正统一图像分割,因为它们需要在语义、实例或全景分割上单独训练,以获得最佳性能。理想情况下,真正通用的框架应该只训练一次,并在所有三个图像分割任务中实现SOTA性能。为此,论文提出了OneFormer!!!这是一个通用的图像分割框架,它将分割与一次多任务训练设计相结合。论文首...
2022-12-12 07:56:00 8443浏览 0点赞 0回复 0收藏
准确和鲁棒的视觉目标跟踪是最具挑战性和最基本的计算机视觉问题之一。它需要估计图像序列中目标的轨迹,仅考虑其初始位置和分割,或者以边界框的形式粗略近似。鉴别相关滤波器(DCF)和深度Siamese网络(SNs)已经成为主要的跟踪范例,这促进了领域的重大发展。随着视觉目标跟踪在过去十年中的快速发展,本次综述基于九个跟踪基准的结果,对90多个DCF和Siamese跟踪器进行了系统和全面的审查。首先介绍了DCF和Siamese跟踪核心公...
2022-12-10 11:12:20 1.5w浏览 0点赞 0回复 0收藏
摘要在2017年TuSimple车道检测挑战赛之后,其数据集和基于accuracy和F1分数的评估已经成为衡量车道检测方法性能的事实标准。虽然它们在提高车道检测方法的性能方面发挥了重要作用,但这种评估方法在下游任务中的有效性尚未得到充分研究。在本文中,我们设计了2个新的面向驾驶的车道检测指标:其中,端到端横向偏差指标(EndtoEndLateralDeviationmetric)(E2ELD)是根据自动驾驶的要求直接制定的,这是车道检测的核心下游任务;...
2022-12-09 07:42:12 5463浏览 0点赞 0回复 0收藏
个人背景学校双985背景,本科和研究生专业都是车辆相关的,但都不是智驾方向的(本科内燃机相关,硕士燃料电池相关)。秋招情况秋招主要投递的是规划控制算法岗控制算法岗。最终拿到的offer也赛道各异:传统主机厂造车新势力底盘线控岗智驾独角兽机器人独角兽企业等比较早确定了自己要转码转智驾的路线,所以硕士期间找了一段主机厂大厂实习一段智驾小厂实习,自己做了两个规控方向的小项目,后续看论文做了优化。由于资源受限...
2022-12-08 21:07:00 7804浏览 0点赞 0回复 0收藏
摘要实时、准确和鲁棒的定位对于自动驾驶汽车(AVs)实现安全、高效驾驶至关重要,而实时性能对于AVs及时实现其当前位置以进行决策至关重要。迄今为止,没有一篇综述文章定量比较了基于各种硬件平台和编程语言的不同定位技术之间的实时性能,并分析了定位方法、实时性能和准确性之间的关系。因此,本文讨论了最先进的定位技术,并分析了它们在AV应用中的整体性能。为了进一步分析,本文首先提出了一种基于定位算法操作能力(LAO...
2022-12-08 21:06:44 6812浏览 0点赞 0回复 0收藏
摘要自动驾驶的发展需要研究和开发准确可靠的自定位方法。其中包括视觉里程计方法,在这种方法中,精度可能优于基于GNSS的技术,同时也适用于无GPS信号的区域。本文深入回顾了视觉和点云里程计SOTA方法,并对其中一些技术在自动驾驶环境中的性能进行了直接比较。评估的方法包括相机、激光雷达和多模态方法,并从共同的角度比较了基于特征知识和基于学习的算法。这些方法在道路驾驶公共数据集上进行了一系列测试,根据这些数据集...
2022-12-06 07:57:35 7945浏览 1点赞 0回复 0收藏
什么是多模态3D目标检测?多模态3D目标检测是当前3D目标检测研究热点之一,主要是指利用跨模态数据提升模型的检测精度。一般而言,多模态数据包含:图像数据、激光雷达数据、毫米波雷达数据、双目深度数据等,本文主要关注于当前研究较多的RGB+LiDAR融合3D目标检测模型进行汇总和总结,希望可以给大家带来一定的启发。欢迎关注国内首个以自动驾驶技术栈为主线的交流学习社区!原文出处:[微信公众号【自动驾驶之心】](https:mp....
2022-12-05 20:57:35 1.0w浏览 0点赞 0回复 0收藏
欢迎关注国内首个以自动驾驶技术栈为主线的交流学习社区!原文出处:[微信公众号【自动驾驶之心】](https:mp.weixin.qq.comsJ4o6VItsR1XjBMURVsVA)代码开源:https:github.commegviiresearchMOTRv2摘要在本文中,作者提出了MOTRv2,一个简单而有效的pipline,通过预训练的目标检测器引导端到端的多目标跟踪。现有的端到端方法,如MOTR[43]和TrackFormer[20],主要由于其检测性能较差而不如其它trackingbydetection的方法。作者...
2022-12-04 09:10:48 7124浏览 3点赞 0回复 0收藏
欢迎关注国内首个以自动驾驶技术栈为主线的交流学习社区!原文出处:[微信公众号【自动驾驶之心】](https:mp.weixin.qq.comsd8cbyPZJufwczvS2sHeuw)论文:https:arxiv.orgpdf2211.09445v1.pdf代码和数据集:https:github.comaimotiveaimotivedataset摘要自动驾驶是计算机视觉领域的一个研究热点。因为自动驾驶汽车对安全性要求很高,确保鲁棒性对现实世界的部署至关重要。虽然有几个公共多模态数据集可以访问,但它们主要包括两...
2022-12-03 16:52:17 6411浏览 2点赞 0回复 0收藏
欢迎关注国内首个以自动驾驶技术栈为主线的交流学习社区!原文出处:[微信公众号【自动驾驶之心】](https:mp.weixin.qq.comsLrgMDvEKNVx8quyFh1BhlQ)PPYOLOER是基于PPYOLOE的高效anchorfree旋转目标检测器,作者在PPYOLOER中引入了一系列有用的技巧,以提高检测精度,同时减少额外参数和计算成本PPYOLOERI和PPYOLOERx在DOTA1.0数据集上分别达到78.14和78.28mAP,使用单尺度训练和测试,这几乎优于所有其它旋转目标检测器。通过...
2022-12-03 16:47:03 8863浏览 0点赞 0回复 0收藏
欢迎关注国内首个以自动驾驶技术栈为主线的交流学习社区![微信公众号【自动驾驶之心】](https:mp.weixin.qq.comsnEZW3BW16Zj6qKdJRqI2UQ)摘要Transformer,一种基于注意力的编码器解码器模型,已经彻底改变了自然语言处理(NLP)领域。受这些重大成就的启发,最近在计算机视觉(CV)领域采用类似Transformer的架构进行了一些开创性的工作,这些工作证明了它们在三个基本CV任务(分类、检测和分割)以及多传感器数据(图像、点...
2022-11-11 07:44:30 1.7w浏览 2点赞 0回复 1收藏
欢迎关注国内首个以自动驾驶技术栈为主线的交流学习社区![微信公众号【自动驾驶之心】](https:mp.weixin.qq.comsA3DLQQSKssPuEfXexscyPw)摘要从RGB图像估计深度是一个长期存在的不适定问题,计算机视觉、图形和机器学习社区已经探索了几十年。在现有技术中,双目匹配仍然是文献中使用最广泛的技术之一,因为它与人类双目系统有很强的联系。传统算法通过在多个图像中匹配人工设计特征来完成深度估计。尽管进行了大量的研究,但...
2022-11-10 07:39:02 1.4w浏览 0点赞 0回复 0收藏
欢迎关注国内首个以自动驾驶技术栈为主线的交流学习社区![微信公众号【自动驾驶之心】](https:mp.weixin.qq.comsSVkb1CJAmH7hGBI0aBinRA)4DRadar在自动驾驶领域中越来越受关注,在价格和功能上都有比较大的竞争力,相关研究也逐渐open,今天为大家盘点下开源的4DRadar数据,为相关科学研究提供保障!Astyx数据集链接:www.astyx.net论文名称:AutomotiveRadarDatasetforDeepLearningBased3DObjectDetectionAstyx数据集是第一个...
2022-11-09 18:21:00 5326浏览 0点赞 0回复 0收藏
欢迎关注国内首个以自动驾驶技术栈为主线的交流学习社区![微信公众号【自动驾驶之心】](https:mp.weixin.qq.comsM47rwwbU0FRrgdXg9c7ww)作者:一天到晚潜水的鱼前言TensorRT是英伟达官方提供的一个高性能深度学习推理优化库,支持C++和Python两种编程语言API。通常情况下深度学习模型部署都会追求效率,尤其是在嵌入式平台上,所以一般会选择使用C++来做部署。本文将以YOLOv5为例详细介绍如何使用TensorRT的C++版本API来部署ON...
2022-11-08 18:44:46 1.7w浏览 0点赞 0回复 0收藏
欢迎关注国内首个以自动驾驶技术栈为主线的交流学习社区![微信公众号【自动驾驶之心】](https:mp.weixin.qq.coms8dLrX4Z3Uq1PJDSRJwUAEA)cameras是自动驾驶系统中的主要传感器,它们提供高信息密度,最适合检测为人类视觉而设置的道路基础设施。全景相机系统通常包括四个鱼眼摄像头,190°+视野覆盖车辆周围的整个360°,聚焦于近场感知。它们是低速、高精度和近距离传感应用的主要传感器,如自动泊车、交通堵塞辅助和低速紧急...
2022-11-07 21:02:57 7507浏览 1点赞 0回复 0收藏
欢迎关注国内首个以自动驾驶技术栈为主线的交流学习社区![微信公众号【自动驾驶之心】](https:mp.weixin.qq.comstuRBwnnjBWuArL5CqjtwiQ)题目:ImprovingtheIntraclassLongtailin3DDetectionviaRareExampleMining作者:waymo摘要深度学习体系结构的不断改进使得3D目标检测器的整体性能稳步提升,在某些任务和数据集中,其整体性能主要由常见样本驱动,达到了与人类相当的水平。然而,即使是性能最好的模型,在遇到训练数据中不...
2022-11-06 09:10:18 6054浏览 1点赞 0回复 0收藏
欢迎关注国内首个以自动驾驶技术栈为主线的交流学习社区![微信公众号【自动驾驶之心】](https:mp.weixin.qq.comsyzrDGnEXDDIII4FloWLJ3w)摘要近年来,基于视觉的传感器在SLAM系统中显示出显著的性能、精度和效率提升。在这方面,视觉SLAM(VSLAM)方法是指使用相机进行姿态估计和地图生成的SLAM方法。许多研究工作表明,VSLAM优于传统方法,传统方法仅依赖于特定传感器,例如激光雷达,即使成本较低。VSLAM利用不同的摄像机类...
2022-11-05 15:48:22 1.2w浏览 0点赞 0回复 0收藏