基于改进分数去噪网络的铁路场景点云模型去噪方法

轨道与基础

基于改进分数去噪网络的铁路场景点云模型去噪方法

闫斌，

汪思成，

胡文博，

王卫东，

邱实，

李正，

王劲

铁道科学与工程学报

第21卷, 第12期

pp.4983-4992

纸质出版 2024-12-28

DOI：10.19713/j.cnki.43-1423/u.T20240342

中图分类号：U216.3

17600

基于点云数据的逆向建模是铁路工程数字化发展的关键步骤，也是铁路数字孪生、结构健康监测等各种延伸应用的基础。为解决传统直接依赖无人机航测数据构建的点云模型存在精度低、可靠性差等问题，尤其是对于复杂的铁路场景，易导致模型与实际偏差过大，提出一种改进的分数去噪网络(Improved Score-based Denoised Network，ISDNet)。该网络在传统分数去噪网络的基础上构建了一套全新的编码器与解码器，在提高三维点云模型精度的同时，有效降低了计算复杂度和计算成本。该算法既减少了无人机逆向三维点云建模过程中由于环境扰动等因素产生的离散噪点，在铁路基础设施的结构细节处理上有较好的表现，将重建后的点云模型测量点坐标与全站仪测量的坐标进行了对比验证。实验验证结果表明，基于ISDNet网络去噪后的铁路场景三维模型的误差降低至原始模型的一半，各测量点间X方向的平均误差为5.67 mm，Y方向的平均误差为6.67 mm，Z方向的平均误差为6.83 mm。去噪后的三维点云模型有效减少了接触网、钢轨等细节数据的丢失，并显示出了更强的形状表征性，能够更清晰。本文所提方法能够实现铁路场景点云模型的高效去噪，并将模型精度进行提高，有效减少了点云模型中各构件细节的丢失，能够为相关的延伸应用提供可靠的技术支持。

无人机三维点云模型铁路工程深度学习点云去噪宏观建模

截至2023年底，全国铁路营业总里程达到15.9万km，其中高速铁路里程达到4.5万km，稳居世界第一^[1]。随着“数字经济”“新基建”“智能高铁”等理念的不断发展，铁路行业的数字化发展和管理需求与日俱增^[2-4]，铁路三维模型的构建作为铁路智能化的重要组成部分，相关建模技术的发展愈发重要。使用Revit等三维软件实施的基于图纸的传统建模方法不仅存在程序复杂、编码周期长的问题，且随着施工进度的推进，设计图纸与铁路实际场景的吻合度逐渐降低，得到的三维模型大多难以实现对实际铁路场景的真实表达和精准映射^[5-6]。亟需开发自动化方法实现针对实际铁路场景的高效建模，达到及时、有效地感知和掌握铁路基础设施的服役状态。无人机可以针对基础设施进行实时三维逆向建模，同时具有拍摄范围广、数据采集效率高的技术优势。得益于三维重建算法的进步，无人机被广泛应用于地貌勘测、城市规划、目标建筑的三维建模等工作^[7-10]。对于三维重建而言，首先通过在目标建筑或区域的上方部署无人机进行倾斜摄影数据采集，然后使用增量式运动恢复结构(structure from motion，SFM)方法实现三维点云重建^[10]。不同于城市建筑物，既有铁路不具备抵近无人机抵近采集的条件^[11]。此外，由于接触网、轨旁设备的电磁效应，数据采集过程中存在的如灰尘、雾、雨、光照变化等造成的干扰，以及遮蔽物等不可抗力因素的影响，基于无人机航测数据直接生成的原始点云模型往往难以对铁路构件进行精细化表征^[12-13]，导致铁路三维点云模型中会出现构件周围存在离散点云、模糊等噪声。早期的点云去噪方法主要依靠复杂的先验知识，如基于密度的点云去噪、基于局部平面拟合的去噪、基于稀疏性的点云去噪方法等^[14-19]，这些方法通常受几何先验知识的影响较大，去噪过程较为复杂且对模型的细节保留较差，去噪效果不稳定。近年来，基于深度学习的点云去噪方法得到了越来越多的关注，并在大多数基础设施场景中展现出极高的性能^[20-24]。如PointCleanNet(PCNet)可以在网络训练完成后直接对噪声点云进行去噪，极大提升了去噪效率^[21]；微流形重构(Differentiable Manifold Reconstruction，DMR)算法可以通过微分池对低噪声进行采样进而过滤高噪声点^[23]。这些方法极大地提高了点云去噪的速度及精度，但对结构物细节的保留仍有不足。不同于一般的建模场景，铁路场景中的各构件相对占比较低(例如接触网、接触柱等)，这些关键构件更容易被去噪网络误判为噪声。此外，铁路结构极高的净空要求也使得模型的背景噪声增多导致处理效率低下。为了解决铁路场景点云数据去噪难、精度差的问题，使用机器学习和深度学习的方法可以对以离群点和异常点噪声为主的铁路场景点云噪声进行有效处理^[25-26]，且在铁路桥梁点云分割中有较好的表现，但对铁路大场景的整体去噪效果仍有不足^[22]，存在精度提升效果差的问题。去噪后的铁路场景高精度三维点云模型不仅可以利用模型中各结构物的三维位置信息进行定位，还可以在铁路智能巡检过程中，通过前后多次构建铁路沿线模型，检测关键结构的位移，并根据位移量及相隔时间绘制关键结构物位移分析表，量化铁路构件位移信息并提出预警方案，为铁路场景的安全运行提供良好的数据基础。本文提出一种改进的分数去噪网络(improved score-based denoised network，ISDNet)，通过密集连接实现了对局部点云形状的鲁棒表征，在提高三维点云模型精度的同时，有效降低了计算复杂度。基于ISDNet网络去噪后的点云模型实现了对复杂铁路场景的高精度和高效重构。

1 铁路场景点云模型去噪方法流程

本文提出一种基于ISDNet分数去噪网络的铁路场景三维逆向建模方法：基于无人机获取铁路场景图像数据，使用SfM方法完成铁路场景三维逆向建模，得到粗糙的原始三维点云模型。然后采用ISDNet深度去噪网络对原始点云模型进行去噪，得到一个较高精度的铁路三维场景模型。本文的理论框架见图1。

图1

铁路场景三维逆向建模方法架构

在铁路场景逆向点云建模的过程中，首先使用无人机对目标区域进行倾斜摄影数据采集，经过特征点的提取和匹配，然后通过尺度不变特征转换(Scale-invariant feature transform，SIFT)算法对空间中的点进行赋值，在利用RTK^[7]建立影像空间拓扑关系后，使用SfM算法建立目标区域的稀疏点云模型。最后，使用光束平差法对点云模型进行增强，建立铁路场景的粗糙点云模型。

基于无人机的铁路场景的点云模型仍旧存在较多噪声，需要进一步消除噪声。通过裁剪粗糙点云，可以大幅降低去噪算法的计算量，提高算法运行速度以及去噪精度。然后，在动态图卷积神经网络(dynamic graph convolutional neural networks, DGCNN)中提出了一种位置编码模块(Pos-Encoding)作为改进，对点云特征进行提取和位置编码，并利用分组卷积密集网络ConDenseNet V2模块对特征进行复用和解码。解码后网络最后输出点云各点的预测分数，通过梯度下降和点云滑动的方法消除模型中的噪声点，以得到优化后的点云模型。

本文设置了2个对比实验。第一，将提出的ISDNet与PCNet、DMR、IterativePFN^[27]、传统分数去噪算法(Score-Based)^[28]等4种算法在召回率、精确率、整体准确率和F1分数4个性能指标下进行对比。第二，将使用ISDNet去噪后的点云模型与全站仪测量点的实际三维坐标进行对比。

2 ISDNet去噪算法改进

2.1　去噪算法整体框架介绍

本文基于铁路场景点云数据的特点，在基于深度学习的点云噪声估计分数方法上提出了改进策略，针对铁路场景元素较多、去噪困难的问题，通过在特征提取部分采用位置编码规则^[29]，对点云临近点进行重新编码排序，并在点云解码部分添加了ConDenseNet V2模块作为分数输出函数，提高了铁路复杂场景下的点云处理精度。

本文提出的ISDNet去噪流程如图2所示。首先将输入的噪声点云进行位置编码，使用动态图卷积模块提取每个点的局部和非局部特征，并输入给ConDenseNet V2特征提取单元，从输入噪声中学习点的特征hi。利用这些特征与理想无噪声点云进行对比并打分。之后通过移动噪声点，使得噪声点更接近于理想的无噪声点云表面，通过对数概率函数执行梯度下降更新点的位置，使得点的预测分数接近于估计分数，从而对点云模型进行有效去噪。

图2

ISDNet网络训练示意图

2.1.1　点云输入预处理

为了实现大规模铁路点云数据的高效加载，本文在网络输入前端加入了一个点云裁剪模块，以5 m的步长将模型裁剪成相同大小的点云集合，通过重复采样(repeat sampling, RS)与最远点采样法(furthest point sampling, FPS)的方式对每一个点云集进行点云的均匀采取，这2种方法分别对应每批点云集合的点数多于或少于设定值的情况。通过这2种方法可以确保输入点云聚类的点数N保持一致，本文将N设置为4 096。这有利于加快算法运行速度，使得算法对局部特征的感知更加准确。为了增加点云聚类的全局特征表示，还加入了全局相对坐标信息，其中，代表点云聚类中的最大坐标，和类似。

2.1.2　特征编码模块

受transformer启发，在动态图卷积神经网络(DGCNN)中提出一种位置编码模块(Pos-Encoding)作为改进，每个点的输入特征信息为，按照顺序对每一个特征向量进行编码，对于每一个点的特征进行编码，获得其初始特征的位置向量。然后，构建一个k最近邻来处理这些点的特征向量，并通过包含了位置编码的DGCNN模型进行特征提取，并更新每个点的特征，这能够为分数估计函数提供局部特征之间的相似性排序信息。对于点附近的近邻点作为输入进行位置编码，位置编码的方法见式(1)，式中：和分别是k近邻点的编码向量的第，个分量；是向量维度，等于近邻点特征向量的维度。编码后单个近邻点的位置编码见式(2)：

(1)

(2)

2.1.3　特征解码模块

对特征提取过程中产生的点云特征进行特征复用是非常有必要的，对已提取的特征进行重复利用，可以帮助网络更好地理解非结构化的点云特征。在目标函数预训练过程中，本文通过使用一个ConDenseNet V2模块对点云的特征进行了特征复用与解码，得到各点最终的分数。ConDenseNetV2模块将先验特征经过多个稠密连接的卷积层进行处理后，将每一层的输出与前面所有层进行合并，以确保每一层卷积层中的信息能够被充分利用。然后，根据特征复用得到的数据特征进行解码，以输出每个点的分数。该模块可以在不增加网络训练时间成本的同时，更准确地提取点云的分布特征，避免错误估计点云局部形状导致铁路场景点云出现扭曲。

单点近邻点集的位置编码表示为。在提取了每个点的初始特征之后，为了利用邻域特征集的排序信息，将位置编码乘以近邻点云特征以进行打分，网络预测分数表示如式(3)。是一个ConDenseNet V2模块，这里的除编码信息外，还包括的k近邻点的排序信息。即得到了既有编码信息又有排序信息的点云特征，作为分数估计的输入。

(3)

2.1.4　噪声分数定义

在得到各点的分数后，将输入噪声点云记为，将地面真值无噪声点云记为。使用Y，定义某点的真实分数如式(4)，其中为返回Y中最接近x的点。直观地说，是从x到下表面的向量。

(4)

训练目标则将网络预测的分数与上面定义的真实分数保持一致，目标函数如式(5)，是在空间中集中在附近的一个分布。最终得到了每个局部分数函数目标的集合L。L即为最终降噪后的三维点云模型。

(5)

(6)

该方法有效避免了其他去噪算法在处理铁路场景时容易将钢轨等关键数据信息误认为噪声进行消除处理的缺点，并利用分组卷积来裁剪掉其中的冗余连接，让网络选择一些有潜力的冗余特征进行重新激活，最大程度发挥网络的特征复用效率。ConDenseNet V2有如下特点：

1) 提升整个网络中信息和梯度的流动性，使网络可以更容易地进行训练，且每一层都可以直接从损失函数和原始输入信号获得梯度，且函数所需参数更少，可以利用更少的卷积获得更丰富的特征信息，在将去噪效果进行提升的同时降低算法运行时间。

2) ConDenseNet V2有正则化的效果，能够减少过拟合风险。

因此，ConDenseNet V2能够在保留点云全局信息的同时降低计算复杂度，在更加轻量化的基础上对特征信息进行最大程度的利用，弥补了传统分数估计算法中点云数据集过大给MLP网络带来的负担。

改进后的去噪网络对噪声卷积分布进行建模，并基于的分数对点云进行去噪，考虑了多种可能的噪声分布情况，使去噪更加准确；同时，点云处理过程中的分数函数是在局部基础上定义的，它学习3D形状的构建块，缩小了三维几何表示的潜在空间，使网络可以更好地学习和重建三维细节。这些特性使得该算法框架更适用于铁路复杂场景去噪任务。

2.2　去噪性能对比

2.2.1　工程案例介绍

本文采用的无人机图像采集设备为DJI MAVIE 3E，配备4/3 complementary metal oxide semiconductor (CMOS) sensor，2 000万像素广角摄像机，搭载机载RTK模块，在RTK工作模式下该无人机的垂直悬停精度为±0.1 m，水平悬停精度为±0.1 m。

在京广铁路长沙至株洲段选取了一段长为300 m，宽为30 m的铁路场景作为目标区域，以验证本文算法去噪性能及针对铁路场景的适用性，共采集了647张图片。为保证图像重叠率，图片正面最小重叠率为80%，侧面重叠率为75%。为了验证模型精度，在测试区域内随机设立了6组标靶作为验证模型精度的测量点(如图3)。基于尺度不变特征转换(SIFT)匹配算法，分析无人机图像数据的空间尺度信息，寻找并提取出关键点的位置、尺度、旋转不变量。然后，对这些关键特征点的方向进行赋值，建立影像空间拓扑关系，利用最近邻原理提高特征点匹配效率，快速建立大量同名像点，实现多图像的快速匹配。

图3

不同算法对铁路场景点云去噪效果示意图

使用空中三角测量法，快速计算地面坐标，得到目标区域的点云数据集。使用SFM点云重建算法建立铁路复杂场景三维模型及原始粗糙点云数据集，经过去噪处理后，得到精细的点云模型。

依据该案例，本文进行了2个验证试验。第1个验证使用4个指标比较了4种不同点云去噪算法的去噪效果。第2个验证使用全站仪对布设的标靶对模型的整体精度进行验证。

2.2.2　不同去噪模型的去噪结果对比

对于去噪性能的验证，将ISDNet与DMR、PCNet、IterativePFN、Score-based算法进行对比。为便于描述，将用于描述分类情况的混淆矩阵进行单独计算，即把当前类当作阳性样本，把其余类当作阴性样本。符号定义如下：TP(真阳性)表示将噪声点预测为噪声点的点数，FN(假阴性)代表将噪声点预测为非噪声点的点数、FP(假阳性)代表将非噪声点预测为噪声点的点数，而TN(真阴性)表示将非噪声点预测为非噪声点的点数。为了量化各去噪算法的性能，使用4项常规指标进行对比：召回率Recall(R)、精确率Precision(P)、整体准确率Overall Accuracy(OA)、F1分数。

(7)

(8)

(9)

(10)

通过选取一段真实铁路场景，以本文提出的铁路场景三维逆向重构方法对目标区域进行模型重建，使用ISDNet算法对重建模型去噪，与PCNet、DMR、IterativePFN、Score-based 4种点云去噪方法对比，统计相关指标，验证不同去噪算法对铁路场景的适应性和去噪效果。

根据表1，本文提出的ISDNet分数估计算法在召回率方面相较于其他算法有一定的提升，该算法在保持点云数据完整性方面具有良好性能。此外，本文算法F1分数最高，避免了过多有效数据损失的同时，亦能维持较高的精确度，与PCNet和DMR、IterativePFN等基于深度学习的方法相比，本文提出的ISDNet在铁路构件的细节保留上有更好的表现，对于离散的点云有较好的收敛效果。展现了该算法在点云去噪方面的优良效果。图3为不同去噪算法对铁路场景的去噪效果示意图。

不同去噪算法性能比较

模型	Recall/ %	Precision/ %	Overall Accuracy/%	F1-Score
PCNet	91.47	90.10	90.85	90.78
DMR	88.91	76.20	83.35	82.07
IterativePFN	86.49	91.26	88.50	88.81
Score-based	73.70	69.50	72.35	71.54
ISDNet	94.22	92.50	91.80	91.86

展开更多

为了避免由于单一测试数据集而导致算法性能难以验证的问题，分别对5段长度为40~50 m、不同位置的铁路线路三维点云模型进行去噪实验并进行多次对比。实验结果表明，本文算法相较于其他去噪算法均有较好的表现，表2为各测试实验集的F1分数对比。其中，表2中线路1即为表1所使用的线路场景，线路1所示各网络F1分数即为表1中各网络的F1分数。

各去噪算法在不同线路中的F1分数比较

模型	线路1	线路2	线路3	线路4	线路5	平均
PCNet	90.78	89.34	91.15	90.71	91.28	89.05
DMR	82.07	83.67	81.85	83.51	82.97	82.81
IterativePFN	88.81	89.67	91.58	90.19	89.98	90.66
Score-based	71.54	75.38	79.24	72.57	59.93	71.73
ISDNet	91.86	90.42	92.47	90.99	92.34	91.62

展开更多

3 铁路场景三维模型测量精度验证

为了验证模型精度，在测区随机设定6个黑白标靶(如图4)，并用全站仪测定各标靶中心点三维坐标(表3)。在对目标区域铁路场景进行无人机点云三维模型重建后，使用本文提出的ISDNet算法进行去噪处理，获得去噪后模型中6个黑白标靶的三维坐标(表4)。

图4

铁路场景三维点云模型示意图

全站仪与去噪前后无人机标靶中心点的坐标

标靶	全站仪坐标			UAV坐标(去噪前)			UAV坐标(去噪后)
标靶	X轴	Y轴	Z轴	X轴	Y轴	Z轴	X轴	Y轴	Z轴
1	-11.223	-26.709	-8.001	-11.202	-26.723	-7.997	-11.217	-26.715	-7.996
2	-3.257	-28.147	-8.998	-3.244	-28.122	-9.013	-3.251	-28.139	-8.991
3	-19.255	-5.211	-8.588	-19.261	-5.191	-8.567	-19.26	-5.207	-8.577
4	-21.425	2.398	-7.451	-21.438	2.413	-7.445	-21.431	2.407	-7.448
5	-14.172	6.109	-7.351	-14.157	6.098	-7.331	-14.163	6.101	-7.359
6	-0.440	8.358	-7.471	-0.437	8.354	-7.499	-0.438	8.363	-7.478

展开更多

去噪前后无人机测量点坐标误差对比

标靶	误差/mm
标靶	去噪前X 方向误差	去噪前Y 方向误差	去噪前Z 方向误差	去噪后X 方向误差	去噪后Y 方向精度	去噪后Z 方向误差
1	21.00	14.00	4.00	6.00	6.00	5.00
2	13.00	25.00	15.00	6.00	8.00	7.00
3	6.00	20.00	21.00	5.00	4.00	11.00
4	13.00	15.00	6.00	6.00	9.00	3.00
5	15.00	11.00	20.00	9.00	8.00	8.00
6	3.00	4.00	28.00	2.00	5.00	7.00
平均值	11.83	14.83	15.67	5.67	6.67	6.83

展开更多

根据表3可比较无人机与全站仪得到的坐标，计算各测点水平误差、高程误差和平均误差。由表4可得，在对点云模型使用了本文提出的去噪算法后，点云模型的平均X方向误差由11.83 mm下降至5.67 mm；Y方向误差由14.83 mm下降至6.67 mm；Z方向误差由15.67 mm降低至6.83 mm。试验证明，与未去噪的无人机点云模型相比，本文算法对铁路场景的测绘精度更高。

4 结论

1) 本文提出的ISDNet算法在传统分数估计算法的基础上加入了一个改进的动态图卷积神经网络作为编码器，使用ConDenseNet V2模块作为解码器对点云中各点进行打分，提高了算法对铁路场景的适应性，尤其是在处理铁路复杂场景时表现出色。与PCNet、DMR、IterativePFN、Score-based 4个模型相比，ISDNet在召回率、精确率、整体准确率和F1分数4个指标中均有较好表现。

2) 通过与全站仪所测三维坐标相比，去噪后的铁路场景三维模型X方向、Y方向、Z方向精度均得到了提升。结果表明，本文算法对于基于无人机构建的铁路真实场景三维模型有较好的精度提升效果，去噪后的三维模型对几个测量点的坐标精度更高，更加贴近真实场景，这为未来铁路场景数字孪生模型构建、结构物位移监测等方面提供了良好的模型基础。

3) 未来需要进一步研究铁路场景高精度三维点云模型在智能巡检、结构监测、灾害仿真和预警方面的应用。通过对三维模型进行高精度分割，并对比不同时期同结构的完整性，可得出伤损信息；对比同结构的三维坐标信息，可以对关键结构的形变进行量化。通过结合铁路重要结构(如边坡)的表观模型和地勘信息，可以建立相关结构的有限元和离散元力学仿真模型，增加仿真的准确度。

参考文献

王召杰

我国高铁运营里程达到4.5万公里

[N]. 人民铁道, 2024-01-12(001).

基于改进分数去噪网络的铁路场景点云模型去噪方法

1 铁路场景点云模型去噪方法流程

2 ISDNet去噪算法改进

2.1 去噪算法整体框架介绍

2.1.1 点云输入预处理

2.1.2 特征编码模块

2.1.3 特征解码模块

2.1.4 噪声分数定义

2.2 去噪性能对比

2.2.1 工程案例介绍

2.2.2 不同去噪模型的去噪结果对比

3 铁路场景三维模型测量精度验证

4 结论

2.1　去噪算法整体框架介绍

2.1.1　点云输入预处理

2.1.2　特征编码模块

2.1.3　特征解码模块

2.1.4　噪声分数定义

2.2　去噪性能对比

2.2.1　工程案例介绍

2.2.2　不同去噪模型的去噪结果对比