2019 年 5 月论文泛读(上) Geometric SLAM(16篇)
文章目录
一、Geometric SLAM 日本国家先进工业科学技术研究所极密特征视觉 SLAM 开源直接法稀疏建图 线模型约束单目漂移 快速 RGB-D 建图的相关粗糙 3D 表示 苏黎世开源室外大场景点云重建 CMU 局部最小化求解
1. 用于移动城市环境的双目里程计
- [1] Delmas P, Gee T. Stereo camera visual odometry for moving urban environments[J]. Integrated Computer-Aided Engineering, 2019 (Preprint): 1-14.
- 用于移动城市环境的双目里程计
- 根据像素聚类,计算像素簇的匹配来剔除运动像素簇
- 奥克兰大学 期刊 Integrated Computer-Aided Engineering 中科院二区,JCR Q1,IF 3.667
摘要
- 本文提出了一种用于估计同步校准双目相机在包含适量运动物体场景中自我运动估计的系统,这在繁忙的道路场景和人口稠密的城市地区特别有用;
- 所提出方法的关键新颖性在于它估计双目帧之间的像素簇的运动,这允许明确地剔除运动中的簇;
- 这与当前最先进的算法形成对比,后者倾向于将移动元素视为异常值,使用诸如 RANSAC 或 M 估计器之类的策略将其移除;
- 但不幸的是,当运动表示像素的很大一部分时,将移动像素视为异常值会产生较差的性能;
- 如果运动是由许多独立移动的物体(例如人或汽车)引起的,则本文所提出的方法克服了这一点,我们的实验在各种城市环境中显示出有较好的结果。
实现方法
- 本文提出的策略是在图像之间找到几个对应的像素簇,然后,使用直接线性变换(DLT),每个集群都能够产生相机在图像之间的独立运动估计;
- 如果场景是在一般的静态背景下,含有一些或许多的独立运动物体,则预计会有各种运动估计;
- 然而,与背景元素关联的元素应该是相对一致的,而与几个独立移动的前景元素关联的元素通常不是;
- 因此,在这种情况下,相机的估计运动可以由一组相应的像素簇来确定,这些像素簇在相机的估计运动方面具有最大的一致性。
- 步骤:
- 步骤一:特征聚类
- 步骤 1:确定图像梯度;
- 步骤 2:提取具有最大梯度的区域作为候选特征点;
- 步骤 3:执行深度过滤移除边缘周围的特征;
- 步骤 4:执行聚类以识别每个聚类特征;
- 步骤二:聚类特征匹配
- 提出的聚类特征的主要目的是在假设帧间存在少量刚体运动的情况下,找出连续帧间的鲁棒对应关系;从多个像素构造一个特征,目的是产生比基于特征描述符或光流匹配单个像素更强的鲁棒匹配;提出的聚类特征的另一个优点是,它由 7 个或更多像素组成,这意味着可以根据其内部对应关系估计聚类特征在图像之间的运动。
- 步骤三:位姿估计
- 步骤一:特征聚类
2. 用于结构化低纹理的平面 RGB-D 视觉里程计
- [2] Guo R, Zhou D, Peng K, et al. Plane Based Visual Odometry for Structural and Low-Texture Environments Using RGB-D Sensors[C]//2019 IEEE International Conference on Big Data and Smart Computing (BigComp). IEEE, 2019: 1-4.
- 用于结构化低纹理的平面 RGB-D 视觉里程计
- 3D 线、平面提取,平面匹配
- 宾夕法尼亚州立大学,国防科大
摘要
- 本文利用平面特征而不是点特征,并提出了一种视觉测距方法来估计传感器对结构和低纹理环境的姿态;
- 我们通过利用基于线特征的相关平面来构建因子图的约束,并且我们推导出平面最小表示的解析雅可比,以加速优化过程;
- 实验证明了我们提出的方法的有效性和鲁棒性,并显示出其优于替代方法的优势。
主要贡献
- 提出了一种基于线-平面特征的视觉测距方法,用于估计结构和低纹理环境下的相机姿态;
- 推导出平面最小表示的解析雅可比解,以加速姿态估计的迭代优化过程。
线约束的平面匹配
- 3D 线提取:利用 LSD 提取 2D 线段,并获得 2D 线段集,并重建他们的 3D 点集;
- 3D 平面提取:快速平面提取算法,包括图像初始化、凝聚层次聚类(AHC)和分割细化,得到平面表示方程;
- 主要参考:Feng C, Taguchi Y, Kamat V R. Fast plane extraction in organized point clouds using agglomerative hierarchical clustering[C]//2014 IEEE International Conference on Robotics and Automation (ICRA). IEEE, 2014: 6218-6225.
- 平面匹配:3D 平面可以由位于这些平面上的线确定(每个平面上的线数不小于2),因此,3D 平面的匹配可以通过 3D 线的匹配来解决。
3. 基于动力学模型的连续时间的双目视觉里程计
- [3] X Wang, F Xue, Z Yan, W Dong, Q Wang, H Zha. Continuous-time Stereo Visual Odometry Based on Dynamics Model⋆[C]. Asian Conference on Computer Vision (ACCV) 2018
- 基于动力学模型的连续时间的双目视觉里程计
- 北京大学,上海交大 ACCV:CCF 人工智能 C 类会议
摘要
- 提出了一种动力学模型来表示相机轨迹作为时间和力的连续函数,配备这样的表示,我们将经典视觉测距问题转换为分析应用于相机的力;
- 与传统的离散时间估计策略相反,相机运动的连续性质在框架中固有地表示,并且可以在时间间隔内仅用少量参数简单地建模相机运动;
- 动力学模型保证了连续的速度,因此确保了平滑的轨迹,该轨迹对噪声具有鲁棒性并且避免了姿态漂移;
- 对真实世界基准数据集的评估表明,我们的方法优于其他连续时间方法。
实现方法
- 在本文中,我们介绍了一种动力学模型,以连续时间的方式表示相机轨迹;
- 通过检测力的变化,轨迹被分割成碎片,在每个段中,动态参数被假定为常数;
- 相机位姿未显式存储,但表示为可在任何时间戳评估的函数,该表示不仅产生平滑且连续的相机运动,而且在每个小段内仅需要很少的参数;
- 由于我们的方法使轨迹平滑,因此可以将其视为具有有效物理解释的低通滤波器;
- 系统的惯性可防止突然跳跃并禁止身体上的非理性移动,这保证了连续的速度,从而确保了平滑且物理上合理的轨迹;
- 这些约束可以减少 VO 中的误差,并增强系统的稳定性,尤其是自动驾驶和混合现实渲染的有益效果;
- 如图所示,应用批量优化来更新常数参数,其中可以容易地建模相机轨迹。
4. 具有概率数据关联的动态物体级 SLAM
- [4] Strecke M, Stückler J. EM-Fusion: Dynamic Object-Level SLAM with Probabilistic Data Association[J]. arXiv preprint arXiv:1904.11781, 2019.
- 具有概率数据关联的动态物体级 SLAM
- Mask R-CNN 实例分割 + 概率数据关联 + EM 算法
- 德国马克斯普朗克智能系统研究所 实验室主页
- Usenko V, Demmel N, Schubert D, et al. Visual-Inertial Mapping with Non-Linear Factor Recovery[J]. arXiv preprint arXiv:1904.06504, 2019.
摘要
- 使用 RGB-D 相机获取稠密 3D 环境地图的大多数方法都采用静态环境或将移动物体作为异常值剔除,然而,移动物体的表示和跟踪对于机器人或增强现实中的应用具有显著的潜力;
- 在本文中,我们提出了一种具有稠密物体级表示的动态 SLAM 的新方法;
- 我们在局部体积有符号距离函数(SDF)图中表示刚体对象,并将多目标跟踪表示为 RGB-D 图像与 SDF 表示的直接对齐;
- 我们的主要创新性是概率公式,有自然的数据关联和遮挡处理的策略;
- 在实验中分析了我们的方法,并证明我们的方法在稳健性和准确性方面与最先进的方法相比是有利的。
主要贡献
- 提出了用于动态对象级 SLAM 的概率 EM 公式,其自然地产生数据关联和遮挡处理策略;
- 基于我们的 EM 公式,我们将多目标跟踪视为 RGB-D 图像与 SDF 对象表示的直接对齐,并评估这种跟踪方法用于稠密动态 SLAM;
- 我们的方法在动态对象级 SLAM 的几个数据集上实现了最先进的性能。
5. 大型室内环境的快速 RGB-D SLAM 方法
- [5] Guclu O, Can A B. k-SLAM: A fast RGB-D SLAM approach for large indoor environments[J]. Computer Vision and Image Understanding, 2019.
- 大型室内环境的快速 RGB-D SLAM 方法
- 土耳其哈西德佩大学 Google Scholor 中科院三区,JCR Q2,IF 2.776
摘要
- 我们提出了一种基于 RGB-D 的 SLAM 系统,能够构建大型室内环境一致性的 3D 地图;
- 系统通过使用帧之间的关键点对应来执行运动估计;
- 开发了一种新的数据关联方法——关键帧自相关数据库和自适应阈值,用于通过稳健的闭环检测进行精确建图;
- 关键帧自相关数据库基于空间颜色相关性对帧进行索引和聚类,并通过使用可以有效处理高维数据的数据结构将短闭环候选和长闭环候选帧作为大小为 k 的簇返回;
- 在我们之前的工作中引入的自适应阈值技术在簇中过滤掉更多的异常值并选择更好的闭环候选者;
- 所提出的方法增量式地生成环境地图而无需任何训练步骤;
- 该系统在广泛使用的具有大量序列的公共数据集上进行测试,实验结果表明,与其他最先进的系统相比,我们的系统在具有挑战性的条件下具有稳健性和高效性;
- 该系统可为中型和大型环境生成精确的地图,并在 CPU 上能达到足够的稳定性和实时性;
- 本文是第一个使用图像自相关图和 k 均值树索引结构用于 SLAM 中的闭环检测问题,用于增加闭环检测的鲁棒性,前期工作 [文献]。
方法
- 通过稀疏特征匹配来估计帧间运动;
- 利用关键帧自相关数据库和自适应阈值方法进行闭环检测;
- 此方法调整每个闭环搜索的动态查询阈值,并有助于消除更多的异常候选。
6. 具有极密度特征点的视觉跟踪与建图
- [6] Yokozuka M, Oishi S, Simon T, et al. VITAMIN-E: VIsual Tracking And Mapping with Extremely Dense Feature Points[J]. arXiv preprint arXiv:1904.10324, 2019.
摘要
- 本文提出了一种新的非直接法单目 SLAM 算法 VITAMIN-E ,该算法由于跟踪了非常密集的特征点,具有很高的精度和鲁棒性;
- 典型的非直接法由于对特征点的精确匹配进行了细致的筛选,在重构稠密几何形状时存在一定的困难;
- 与传统方法不同的是,本方法通过跟踪由主流估计(dominant flow estimation)提供的局部曲率极值来处理大量的特征点;
- 由于 BA 计算量大,本文提出了一种新的优化方法——子空间高斯牛顿法(subspace GaussNewton method),通过局部更新变量,极大地提高了 BA 的计算效率;
- 同时从重建的点生成网格,并将它们合并为一个完整的三维模型;
- 在 EuRoC 上的实验结果表明,该方法在轨迹估计的精度和鲁棒性方面均优于 DSO、ORB-SLAM 和 LSD-SLAM 等最先进的 SLAM 方法;
- 该方法只需要一个 CPU,就可以从密集的特征点中实时生成非常详细的三维几何图形。
主要贡献
- ① 首先提出了一种新的基于主流估计和曲率极值跟踪的稠密特征点跟踪算法;
- 这使得系统能够处理大量的特征点,但维护他们又会造成很高的计算成本;
- ② 提出一种新的优化方法——子空间高斯牛顿法,用于 BA 优化;
- 通过局部更新变量,显著提高 BA 的效率;
- ③ 从重建的特征点中生成网格,并使用 TSDF 将他们集成在一起;
- 与传统方法比较本方法只需要再 CPU 上就能实时地重建三维几何结构。
7. 直接法稀疏建图
- [7] Zubizarreta J, Aguinaga I, Montiel J M M. Direct Sparse Mapping[J]. arXiv preprint arXiv:1904.06577, 2019.
- 直接法稀疏建图
- 西班牙萨拉戈萨大学 代码开源(还未放出) 演示视频
- 作者 2018 年 ECCV 一篇文章:可变形贴图中 SLAM 的相机跟踪 Camera Tracking for SLAM in Deformable Maps
摘要
- Photometric bundle adjustment,准确地从视频序列中估计几何信息,但是当前的 PBA 系统的临时地图无法管理场景重新观察;
- 本文提出 DSM ,一个基于 PBA 的完整的单目 SLAM 系统,其持久性地图处理重新观测,以直接法在 Euroc 上获得了准确的结果。
主要贡献
- 持久性地图,允许直接使用光度公式重用现有地图信息;
- 局部地图可视化窗口(LMCW)标准,用于选择观察相同场景区域的活动关键帧(即使它们没有及时关闭)和地图点重新观测;
- 粗略到精细的优化方案,增加了 PBA 的收敛半径,该策略允许利用点重新观测提供的丰富的几何信息;
- 一个鲁棒的影响函数和一个基于 t 分布的异常值管理策略,它确保了 PB A的一致性,以防止来自激活远程关键帧的伪观测;
- 在公开的 EuRoC MAV 数据集中对 DSM 进行了实验验证,首次报道了相机轨迹和重建图的定量结果,后者通常不在 VO/VSLAM 方法中报告,在单目直接法中,我们得到了迄今为止最准确的结果;
- 代码开源:https://github.com/jzubizarreta/dsm (还未放出)
8. 基于线模型的室内单目定位漂移估计方法
- [8] Feng G, Ma L, Tan X. Line Model-Based Drift Estimation Method for Indoor Monocular Localization[C]//2018 IEEE 88th Vehicular Technology Conference (VTC-Fall). IEEE, 2019: 1-5.
- 基于线模型的室内单目定位漂移估计方法
- 哈工大 VTC 无线通信会议,一年两届
摘要
- 当前,单目定位作为一种基于视觉的室内定位方法因其在室内导航和增强现实中的应用而备受关注;
- 在典型的单目定位系统中,利用绝对位置估计来获取查询相机的初始位置,然后采用相对位置估计来实现后续的相机位置;
- 然而,由相对位置估计引起的累积误差,即局部漂移严重影响定位性能;
- 因此,引入了包含拟合线段和一些视觉特征的线模型,并且线模型用于寻找用于漂移估计的内点;
- 基于预先构建的稠密三维地图,提出了一种基于线模型的漂移估计方法来监测累积误差;
- 作为切换机制,所提出的方法确定相对位置估计何时应切换到绝对位置估计以校正用户位置;
- 与现有的单目定位方法相比,所提出的漂移估计方法显着地减少了累积误差,并且通过给出适当的漂移阈值将平均误差限制在期望的范围内;
- 实验结果表明,在 50 cm 的漂移阈值下所提出的方法的平均定位误差在各种场景中被限制在 30 厘米以内。
实现方法
- 本文提出了一种独立于闭环的基于线模型的漂移估计方法,以消除局部定位引起的累积误差;
- 在漂移估计的过程中,首先在预先构建的 3D 地图的基础上建立一些线模型;
- 然后,通过三角测量获得的具有估计位置的视觉特征被划分为内点和异常值,并且仅使用内点来计算漂移距离;
- 所提出的漂移估计方法监视累积误差,一旦误差超过给定的漂移阈值,将激活全局定位以消除错误。
9.通过约束-合作策略实现高效的机载双目 SLAM
- [9] Castro G, Nitsche M A, Pire T, et al. Efficient on-board Stereo SLAM through constrained-covisibility strategies[J]. Robotics and Autonomous Systems, 2019.
- 通过约束-合作策略实现高效的机载双目SLAM
- 阿根廷布宜诺斯艾利斯大学博士 双目 PTAM 作者 Google Scholor RAS 中科院三区,JCR Q2
- SPTAM:https://github.com/lrse/sptam Pire T, Fischer T, Castro G, et al. S-PTAM: Stereo parallel tracking and mapping[J]. Robotics and Autonomous Systems, 2017, 93: 27-42.
摘要
- 视觉 SLAM 是一项计算成本高昂的任务,随着探索区域大小的增加,其复杂性无限增长,当针对嵌入式应用时,这将成为一个问题,其中实时执行是必要满足的,而计算资源是限制因素;
- 本文提出的方法引入了基于可见度图的地图表示,其允许视觉 SLAM 系统以不依赖于地图大小的复杂性来执行;
- 所提以 S-PTAM 为基础,产生一个精确而鲁棒的双目 SLAM 系统,能够在有限的硬件限制下实时工作。
主要贡献
- 对系统中每个并行模块的更详细的描述,包括一系列并行化见解,并对所涉及的每个任务进行适当的评估;
- 围绕最近地图区域的有效局部优化策略,由跟踪过程中计算的共享协同信息决定;
- 提供了一个功能齐全的双目 SLAM 系统,具有启用闭环的功能,能够在嵌入式低资源处理单元上实时运行。
10. 应用于快速 RGB-D 建图的相关 粗糙 3D 表示
- [10] Canovas B, Rombaut M, Nègre A, et al. A Coarse and Relevant 3D Representation for Fast and Lightweight RGB-D Mapping[C]//VISAPP 2019-International Conference on Computer Vision Theory and Applications. 2019.
- 应用于快速 RGB-D 建图的相关粗糙 3D 表示
- 格勒诺布尔计算机科学实验室
摘要
- 本文提出了一种新颖的轻量级和简单的 3D 表示,用于使用 RGB-D 相机实现静态环境的实时密集 3D 建图;
- 我们的方法构建并更新观察场景的低分辨率 3D 模型,作为一组称为超面元(supersurfels) 的无序新基元,可以看作是由超像素分段 RGB-D 实时测量生成的椭圆平面贴片;
- 虽然大多数实际解决方案都侧重于重建的 3D 模型的准确性,但本文实施的方法非常适合在具有减少/有限的计算能力和存储器大小的机器人上运行,其不需要高度详细的环境地图但是可以适应近似的一个。
11. 鲁棒的室外大场景点云重建
- [11] Ziquan Lan, Zi Jian Yew, Gim Hee Lee. Robust Point Cloud Based Reconstruction of Large-Scale Outdoor Scenes[C], ICRA 2019.
摘要
- 提出了一种基于双目相机的稠密建图算法,用于大规模动态城市环境;
- 与其他现有方法相比,我们同时分别重建静态背景,移动物体和可能移动但当前静止的物体,这对于高级移动机器人任务(例如拥挤环境中的路径规划)是有价值的;
- 使用实例感知语义分割和稀疏场景流来将对象分类为背景,移动或潜在移动,从而确保系统能够模拟具有从静态转变为动态的对象的模型,例如停放的汽车;
- 给定从视觉里程计算估计的相机位姿,通过融合从双目相机计算的深度图,分别重建背景和(可能)移动物体;
- 除了视觉里程计之外,稀疏场景流还用于估计检测到的移动物体的 3D 运动,以便精确地重建它们;
- 进一步开发了一种地图修剪技术,以提高重构精度并减少内存消耗,从而提高可扩展性;
- 在 KITTI 数据集上彻底评估我们的系统,能够在大约 2.5Hz 的 PC 上运行,主要瓶颈是实例感知语义分割,这是我们希望在未来工作中解决的限制,代码开源。
主要贡献
- 开发了一种基于双目相机的高效稠密建图的鲁棒算法;
- 该系统以在线方式构建高质量的静态地图以及移动和潜在移动物体的单独 3D 重建;
- 提出了一种地图修剪技术,以进一步提高建图精度,减少内存消耗,从而提高系统的可扩展性。
方法与流程
12. 利用稀疏语义三维地图进行可视化定位
- [12] Shi T, Shen S, Gao X, et al. Visual Localization Using Sparse Semantic 3D Map[J]. arXiv preprint arXiv:1904.03803, 2019.
- 利用稀疏语义三维地图进行可视化定位
- 中国科学院自动化研究所模式识别国家重点实验室
摘要
- 在各种观看条件变化(包括季节和照明变化,以及天气和昼夜变化)下,精确和稳健的视觉定位是许多计算机视觉和机器人应用的关键组成部分,在这些条件下,大多数传统方法都无法定位相机;
- 在本文中,我们提出了一种可视化定位算法,该算法将基于结构的方法和基于图像的方法与语义信息相结合;
- 给定关于查询和数据库图像的语义信息,根据 3D 模型和查询图像的语义一致性对检索到的图像进行评分;
- 然后将语义匹配得分用作 RANSAC 采样的权重,并通过标准 PnP 求解器求解姿势;
- 对具有挑战性的长期视觉定位基准数据集的实验表明,与现有技术相比,我们的方法有了显着的改进。
主要贡献
- 提出了一种新的定位方法,它结合了基于结构的方法和基于图像的方法,同时利用了语义信息;
- 与最先进的语义视觉定位方法相比,我们不需要任何额外的限制(已知的相机高度和 groundtruth 的重力方向)
实现方法
- 1. 首先根据标准的 SFM 算法构建场景的稀疏 3D 模型;
- 2. 给定每个数据库图像的语义分割,可以为每个 3D 点分配语义标签,是的标准的 3D 模型变为稀疏语义 3D 地图;
- 3. 然后使用图像检索方法获取一组候选数据库图像序列;
- 4. 通过当前帧与候选帧之间间接的 2D-2D 特征匹配,在当前帧和 3D 语义地图之间建立 2D-3D 匹配,并使用这些匹配估计临时的相机位姿;
- 5. 给定了该估计的位姿和语义分割结果,所有 3D 模型被投影到当前图像中,测量 3D 点和当前帧投影的语义一致性,并将其用作当前帧和所有候选帧的 2D-3D 匹配权重;
- 6. 使用与所有检索到的图像相关的 2D-3D 匹配以及它们的一致性权重在基于 RANSAC 位姿估计期间进行偏置采样。
13. 稠密重建的概率投影关联和语义引导重定位
- [13] Yang S, Kuang Z F, Cao Y P, et al. Probabilistic Projective Association and Semantic Guided Relocalization for Dense Reconstruction[C]//ICRA 2019.
- 稠密重建的概率投影关联和语义引导重定位
- 清华大学 谷歌学术
摘要
- 本文提出一个实时的稠密建图系统,使用预测的 2D 语义标签来优化重建的几何质量;
- 将卷积神经网络(CNNs)与相机轨迹估计 SLAM 系统相结合,实现了三维场景的增量融合与标注,将这些语义预测结果结合起来,可以进一步提高重建的几何质量,而现有的方法并没有充分利用这些结果;
- 本文提出使用语义信息来改进重建流程中的两大关键模块:跟踪和闭环检测,以相互促进几何重建和语义识别;
- 对于跟踪,我们使用新颖的概率投影关联方法来有效地挑选候选对应关系,其中这些对应关系的置信度被量化为关于所有可用的短期不变特征的相似性;
- 对于闭环检测,我们通过 Randomized Ferns 将这些语义标签合并到原始编码中,以生成用于检索候选闭环帧的更全面的表示。
- 在公开可用的合成数据集上对这两个修改后的模块和所提议的系统进行的评估表明,我们的方法是有效的,该方法将这些语义提示视为实现更高几何质量的可靠特征。
实现方法
1. 跟踪模块
- 通过将重建后的稠密地图投影到有组织的图像中,这三种类型的注册(帧-模型、帧-帧、模型-模型) 都可以以统一的对应搜索方式进行;
- 本文提出一种新的概率投影关联方法来替代 KinectFusion 的原始投影关联,用于构造对应关系和注册图像;
- 具体来说,在跟踪模块中,当执行帧到模型的配准时,输入帧的语义标签会随着估计的位姿迭代优化,最终在位姿估计完成后再发送到闭环模块。
左图是跟踪模块的概率投影关联原理图,原始的投影关联以红色表示,本文提出的绿色概率关联使用一个考虑传感器噪声的区域来寻找多个候选对应,每个对应的置信度根据像素之间的外观相似性来分配 (青色和棕色代表两个不同的语义标签)。
右图是本文方案(绿色)与 ElasticFusion(红色) 的比较,并在右下角的增量语义融合显示 3D 标记结果。
2. 闭环优化模块
- 其他两种类型的注册,即原始 ElasticFusion 中的帧到帧和模型到模型的方法分别用于验证候选全局和局部闭环;
- 为了检测全局闭环,所提出的系统维护由历史关键帧组成的数据库,并且当找到类似的关键帧时,新帧将触发验证;
- 为了检测局部闭环,地图中的表面按其上次更新时间分为“活动”或“非活动”两种类型,并在这两个光线扫描帧之间执行验证,以检测和恢复由顺序跟踪的累积漂移引起的可能的错位;
- 然后通过 Randomized Ferns(Real-time RGB-D camera relocalization via randomized ferns for keyframe encoding 2015) 将更高级别的语义特征结合到原始编码中,以获得每个关键帧的代表性代码,以便有效地进行检索;
- 此外,这些验证是基于联合概率,考虑所有可用的短期不变特征而不是仅评估几何收敛的原始 ICP 残差;
- 对于如何将这些已建立的约束应用于场景,参考原始的 ElasticFusion。
14. 基于深度学习的动态环境单目 SLAM
- [14] Xiao L, Wang J, Qiu X, et al. Dynamic-SLAM: Semantic monocular visual localization and mapping based on deep learning in dynamic environment[J]. Robotics and Autonomous Systems, 2019.
- 基于动态环境深度学习的单目 SLAM
- 中国科学院电子研究所传感器技术国家重点实验室 期刊 中科院三区 JCR Q2
摘要
- 在动态环境中工作时,传统的 SLAM 框架由于动态对象的干扰而表现不佳,通过利用物体检测的深度学习方法,提出了一种名为 Dynamic-SLAM 的语义 SLAM 框架,以解决动态环境中 SLAM 的问题;
- 首先,基于卷积神经网络,构造组合先验知识的 SSD 目标检测器,以在语义级别检测新检测线程中的动态对象;
- 然后,鉴于现有 SSD 目标检测网络的低召回率,提出了一种基于相邻帧速度不变性的漏检检测补偿算法,大大提高了检测的召回率;
- 最后,构建了基于特征点的视觉 SLAM 系统,该系统通过跟踪线程中的选择性跟踪算法处理动态物体的特征点,从而显着减少由不正确匹配引起的姿态估计误差。
- 与原始 SSD 网络相比,系统的召回率从 82.3% 提高到 99.8% ;
主要贡献
- 鉴于现有 SSD 目标检测网络的召回率较低的问题,针对 SLAM 系统提出了基于相邻帧速度不变性的漏检检测补偿算法,大大提高了检测的召回率,为以下模块提供了良好的基础;
- 提出了一种选择跟踪算法,以简单有效的方式消除动态对象,提高了系统的鲁棒性和准确性;
- 构建基于特征点法的视觉动态 SLAM 系统,基于 SSD 卷积神经网络,将深度学习技术构建到一个新的目标检测线程,该线程结合了先验知识,实现了机器人定位和建图中语义层面动态对象的检测。
15. 不要忽略局部最小化:一种完整的 3D 对应姿态估计解决方案
- [15] Zhou L, Wang S, Ye J, et al. Do not Omit Local Minimizer: a Complete Solution for Pose Estimation from 3D Correspondences[J]. arXiv preprint arXiv:1904.01759, 2019.
- 不要忽略局部最小化:一种完整的 3D 对应姿态估计解决方案
- CMU
摘要
- 从给定的 3D 对应关系中估计位姿,包括点对点,点到线和点到平面的相关性,是计算机视觉中许多应用的基本任务;
- 我们为此任务提供了完整的解决方案,包括解决最小问题和此任务的最小二乘问题;
- 以前的工作主要集中在寻找全局最小化器以解决最小二乘问题,然而,实现全局最小化器的能力的现有工作仍然不适用于实时应用;
- 此外,作为本文的贡献之一,我们证明了对于任意数量的线和平面存在模糊的配置,这些配置理论上有几种解决方案,这使得正确的解决方案可能来自局部最小化器;
- 我们的算法能够有效地揭示局部最小化,我们采用 Cayley-Gibbs-Rodriguez(CGR)旋转参数化来得出三种 3D 对应情形的一般合理成本;
- 本文的主要贡献是求解最小问题的最终方程系统和最小二乘问题的一阶最优性条件,两者都是复杂的有理形式,我们算法的核心思想是引入中间未知数以简化问题;
- 大量的实验结果表明,当对应关系的数量很少时,我们的算法明显优于以前的算法,此外,当全局最小化器是解决方案时,我们的算法实现了与先前保证全局最优性的算法相同的精度,但是我们的算法适用于实时应用。
主要贡献
- 首先,我们证明存在任意数量的平面和线对应的模糊配置,这导致多种解决方案,当配置近似模糊时,问题的正确解决方案可能来自局部最小值;
- 因此,在这种情况下,仅计算全局最小化器的先前工作[25,26,4]将失败,说明局部最小化器对于处理所有配置的算法至关重要;
- 其次,我们提出了一个有效和准确的解决最小二乘法三维配准问题的方法;
- 我们使用 CGR 参数来表示旋转,从而产生一个合理的成本函数;
- 我们得到了它的一阶最优性条件,它们形成了一个高阶多项式系统,难以求解;
- 引入了四个中间未知数来松弛原问题,使得一阶最优性条件简单得多;
- 采用grobner-basis方法[8]求解该方程组;
- 然后我们用牛顿-拉斐逊方法对其进行了改进。
- 第三,我们为潜在的最小配置提供统一的解决方案,以前的算法被提出来逐案解决最小问题[6,32,31];
- 我们还使用 CGR 参数化来表示旋转,它为最小化配置生成三阶方程系统;
- 引入三个中间未知数以简化方程系统;
- 引入一种新颖的隐变量方法[8]来求解旋转矩阵的第二阶方程系统,然后可以从线性系统计算平移。
16. 三维多视角对齐中微型闭环的最小求解器
- [16] Miraldo P, Saha S, Ramalingam S. Minimal Solvers for Mini-Loop Closures in 3D Multi-Scan Alignment[C]. CVPR 2019.
- 三维多视角对齐中微型闭环的最小求解器
- 美国犹他大学
- ICRA 2019:POSEAMM: A Unified Framework for Solving Pose Problems using an Alternating Minimization Method
摘要
- 在诸如 Kinect 和 Velodyne 之类的 3D 传感器的背景下,3D 扫描配准是经典但非常有用的问题,虽然存在若干现有方法,但是这些技术通常是增量式的,其中首先计算相邻扫描以获得初始姿势,然后进行运动平均和 BA 细化;
- 在本文中,我们采用了一种不同的方法,并开发了最小的求解器,用于联合计算小闭环中相机的初始姿态;
- 对于经典的两帧之间的匹配,可以使用最小 3 个点的匹配来计算 6 自由度的相对运动(P3p);
- 另一方面,为了共同计算 n 个周期中的三维注册,我们在前 n-1 连续对(即帧 1 和 2,n -1 和 n)和帧 1 和帧 n 之间进行 2 点匹配;
- 总之,我们使用 5,7,10 点匹配进行 3,4,5 次闭环,并分别恢复 12,18,24 度的变换变量;
- 使用模拟和实际数据,表明使用微型 n 循环的 3D 配准在计算上是有效的,并且与标准成对方法相比可以提供替代的和更好的初始位姿。
主要贡献
- 本文为 3D 点云注册中的微型 n−cycles 提出了新的最小化求解器;
- 提出了三个解决方案,用于一般的 6 自由度和平面运动的 3 ,4 ,5-cycles;
- 表 1 中显示了不同的 n−cycles 所需的点对应关系以及解决方案的数量;
- 据我们所知,我们是第一个提出并解决这些案例的人。
wuyanminmax@gmail.com
2019.05.05