用于SLAM的神经隐含可扩展编码

摘要
最近，神经隐含表征在各个领域显示出令人鼓舞的结果，包括在同步定位和映射（slam）方面取得的可喜进展。然而，现有的方法产生了过度平滑的场景重建，并且难以扩展到大场景。这些限制主要是由于其简单的全连接网络结构，没有将局部信息纳入观察范围。
在本文中，我们提出了nice-slam，这是一个密集的slam系统，通过引入分层的场景表示，纳入了多层次的本地信息。用预先训练好的几何先验来优化这个表示，可以在大的室内场景中进行详细的重建。与最近的神经隐含slam系统相比，我们的方法更具可扩展性、效率和鲁棒性。在五个具有挑战性的数据集上进行的实验表明，nice-slam在映射和跟踪质量方面都具有竞争力。
主要贡献
我们提出了nice-slam，一个密集的rgb-dslam系统，它具有实时性、可扩展性、预测性和对各种挑战性场景的鲁棒性。
nice-slam的核心是一个分层的、基于网格的神经隐式编码。与全局神经场景编码相比，这种表示法允许局部更新，这是大规模方法的一个先决条件。
我们在各种数据集上进行了广泛的评估，证明了在映射和跟踪方面具有竞争力的性能。
主要方法
我们的方法将rgb-d图像流作为输入，并以分层特征网格的形式输出摄像机的姿势和学习到的场景表示。从右到左，我们的管道可以被解释为一个生成模型，它根据给定的场景表示和摄像机姿势渲染深度和颜色图像。在测试时，我们通过逆向传播图像和深度重建损失来解决逆向问题，并通过可区分的渲染器（从左到右）来估计场景表现和摄像机的姿势。
这两个实体都是在交替优化中估计的。映射：逆传播只更新层次化的场景表示。跟踪：逆传播只更新摄像机的姿态。为了提高可读性，我们将用于几何编码的细尺度网格与同等大小的颜色网格结合起来，并将它们显示为具有两个属性（红色和橙色）的一个网格。
1. 层次化的场景表示
现在我们介绍一下我们的分层场景表示，它结合了多级网格特征和预训练的解码器，用于占用率预测。几何图形被编码成三个特征网格j l θ和它们相应的mlp解码器f l，其中l∈{0，1，2}是指粗、中、细三级场景细节。此外，我们还有一个单一的特征网格ψω和解码器gω来模拟场景外观。这里θ和ω表示几何和颜色的可优化参数，即网格中的特征和颜色解码器中的权重。
2. 深度和色彩渲染
给定相机的固有参数和当前相机的姿势，我们可以计算出一个像素坐标的观察方向r。我们首先沿着这条射线对nstrat点进行分层采样，同时对靠近深度的nimp点进行均匀采样1。
我们对每条射线总共取样n=nstrat+nimp点。更正式地说，让pi = o + dir, i∈ {1, - -, n}表示给定摄像机原点o的射线r上的采样点，di对应于pi沿该射线的深度值。对于每一个点pi，我们可以计算出它们的粗粒度占用概率o0 pi，细粒度占用概率opi，和颜色值cpi。
最后，对于每条射线，在粗略和精细层面的深度，以及颜色可以被呈现为：
3. 建图和跟踪
建图。
为了优化上文提到的场景表示，我们从当前帧和选定的关键帧中均匀地取样共m个像素。接下来，我们以分阶段的方式进行优化，以最小化几何和光度损失。
几何损失仅仅是观测值和预测深度之间的l1损失，在粗略的或精细的水平上为：
光度损失为：
相机跟踪。
除了优化场景表示外，我们还平行运行摄像机跟踪，以优化当前帧的摄像机姿势，即旋转和平移{r，t}。为此，我们对当前帧中的mt像素进行采样，并应用上面相同的光度损失，但使用一个修改过的几何损失：
修改后的损失在重建的几何形状中减少了某些区域的权重，例如物体的边缘。摄像机跟踪最终被表述为以下最小化问题：
4. 关键帧的选择与其他slam系统类似
我们用一组选定的关键帧不断优化我们的分层场景表示。我们按照imap的方法维护一个全局关键帧列表，我们根据信息增益逐步添加新的关键帧。然而，与imap相比，我们在优化场景几何时只包括与当前帧有视觉重叠的关键帧。这是可能的，因为我们能够对我们的基于网格的表示进行局部更新，而且我们不会像imap那样存在关键帧消失的问题。
这种关键帧选择策略不仅确保了当前视图之外的几何形状保持静态，而且还导致了一个非常有效的优化问题，因为我们每次只优化必要的参数。在实践中，我们首先随机地对像素进行采样，并使用优化后的相机姿势对相应的深度进行反投影。
然后，我们将点云投影到全局关键帧列表中的每个关键帧。从这些有点投射到的关键帧中，我们随机选择k-2帧。此外，我们还将最近的关键帧和当前的帧包括在场景表示优化中，形成总共k个活动帧。
主要结果

分析PLC控制系统中存在的干扰并研究解决方法
SIM卡槽的结构设计
浅析人工智能商业化落地的关键因素
小米6最新消息：中规中矩，我还是等小米mix2吧！
纳特通信EMC功放设备选型表
用于SLAM的神经隐含可扩展编码
英特尔至强E-2200处理器现可用于入门级服务器
智能音箱：云端的“耳朵”，还是身边的“任意门”？
德承DI-1000 助力火车智慧监控成就乘客安全旅程
python机器学习概述
灵活控制输出电压的启动顺序
各种测距传感器工作原理及应用
京东方液晶面板成本价出售,销量稳居全无第一
LED产业发展会有哪些机遇与挑战
佳能专利显示开发压力触摸方案：取代传统机械式快门
Formnext2019 3D打印火箭发动机惊艳亮相
CRT的工作原理
18家人工智能、26家集成电路企业，离科创板更近
PLC安全门两区域间光电-故障控制改进
智能锁行业的现状分析