logo

基于经验约束神经网络的高速铁路路基累积变形预测研究

高速铁路技术

基于经验约束神经网络的高速铁路路基累积变形预测研究

志兴
林荣
永威
武斌
铁道科学与工程学报第22卷, 第2期pp.469-484纸质出版 2025-02-28
1100

掌握高速铁路路基变形发展对变形病害的控制与运营管理意义重大。目前,机器学习方法被广泛应用于累积变形预测,而传统机器学习路基累积变形预测模型存在时间分布外泛化性差的弊端。因此,提出一种基于经验约束神经网络(ECNN)的高速铁路路基累积变形预测方法。首先,基于工程现场或室内试验数据构建路基累积变形预测数据集,并划分为训练集和测试集;其次,基于训练集建立神经网络模型,综合测试集上的预测精度与误差、预测不确定性2个层次结果,确定最优神经网络预测模型;最后,利用最优神经网络模型驱动路基累积变形的数据信息,并以损失函数修正的方式嵌入累积塑性应变关系曲线(经验信息),实现对最优神经网络模型参数和损失函数的约束,完成ECNN模型构建。案例分析表明:双向门控循环单元(Bi-GRU)模型为最优的神经网络预测模型,拟合优度R2达到0.972 59,扩展不确定性U95和标准化平均差fsmd仅为0.015 6、0.181 09;相较于Bi-GRU模型,ECNN模型在预测精度与误差、预测不确定性2个层次均更优,表明考虑经验信息约束的ECNN模型具备更强的预测性能;ECNN模型相较于Bi-GRU模型具有优异的时间分布外泛化性能,当训练集覆盖的时间跨度较小时,可有效提高累积变形的预测精度。研究成果可为高速铁路路基累积变形预测提供新参考。

高速铁路累积变形预测经验约束神经网络神经网络累积塑性应变关系

列车荷载作用下,高速铁路路基会产生不可恢复的永久变形[1]。而过量的永久变形易导致路基不均匀下沉或沉降超限病害,严重威胁高速列车运行安全[2],因此高速铁路对路基永久变形有严格的限制[3]。若能通过预测手段掌握高速铁路路基变形发展,对于变形病害控制与运营管理意义重大。路基累积变形预测模型是获取高速铁路路基长期变形发展的重要手段。目前,路基累积变形预测模型主要包括经验方法、数值模拟方法、统计分析方法和机器学习方法4个种类。经验方法基于试验结果来建立预测路基累积变形的数学方程[4],具有无法量化非线性问题的弊端;数值模拟方法可考虑多种模拟条件[5]、统计分析方法基于饱和土理论或变形规律建立数学模型[6],但均具有内部参数设置困难、过于依赖假设的弊端[7]。相比之下,机器学习方法具有非线性映射、自适应学习、高预测精度等优势[8],逐渐被推广应用于累积变形预测。例如,CHEN等[9-11]的研究均证明了机器学习方法在路基累积变形预测上的适用性,也推动机器学习方法在高速铁路工程中的应用。通常,机器学习方法需要较大的训练样本支撑,而高速铁路速度快、客运任务重且具有封闭性[12],因此实际工程中可能面临不充足训练数据的问题,这对于预测模型的时间分布外泛化性能提出更高要求。而在传统机器学习路基累积变形预测模型中,训练集和测试集(用于测试模型预测精度)是按照时间顺序从数据集中划分的,通常各自占比70%与30%[13]或80%与20%[14]。这一方式使得训练集和测试集在时间上具有相似的分布,因此所得预测模型虽然在测试集上表现较好,但往往只有分布内的泛化能力,存在时间分布外泛化性差的弊端。近年来,研究者发现工程中的基础理论可为解决机器学习预测模型的时间分布外泛化问题提供支撑。其中,最具代表性的是RAISSI等[15]提出的物理信息神经网络(physical information neural network, PINN)。PINN通常将特定领域的物理信息作为约束条件纳入损失函数,可提高机器学习模型的分布外泛化性[16],该方法已广泛应用于力学[17]、医学[18]、工程[19]等多个领域。然而,由于高速铁路路基累积变形的影响因素众多,因此较难找到一个能够支撑机器学习建模的物理方程。对比而言,经验信息简要总结了高速铁路路基累积变形这一复杂的发展过程,且经过长期试验与工程实例的验证[20];虽然不如物理信息那样精确,但在一定程度上也能揭示路基累积变形的发展趋势和潜在规律[21]。故在物理信息无法快速获取和有效量化的条件下,经验信息相对而言更适合作为机器学习路基累积变形预测模型中的约束条件。因此,如何利用高速铁路工程领域已有的经验知识,构造具有时间分布外泛化性的路基累积变形预测模型是一个值得探索的问题。综上,提出一种基于经验约束神经网络(empiricism-constrained neural network, ECNN)的高速铁路路基累积变形预测方法。首先,构建路基累积变形预测数据集,并划分为训练集和测试集;其次,基于训练集建立神经网络模型,综合预测精度与误差、预测不确定性2个层次结果确定最优神经网络预测模型;最后,利用最优神经网络模型驱动路基累积变形的数据信息,并以损失函数修正的方式嵌入累积塑性应变关系曲线(经验信息),实现对最优神经网络模型参数和损失函数的约束,完成ECNN模型构建。借助杭绍台高速铁路的路基试验段验证了所提方法的有效性。

1 基于经验约束神经网络的高速铁路路基累积变形预测方法

1.1 神经网络算法

图1所示,采用反向传播(back propagation, BP)、极限学习机(extreme learning machine, ELM)、双向门控循环单元(bidirectional gate recurrent unit, Bi-GRU)这3种典型的神经网络算法(属于机器学习算法)对高速铁路路基累积变形进行预测。BP是一种基于梯度下降的神经网络,其核心在于计算网络输出层与真实值之间的误差,并不断调整网络参数使得总误差最小;ELM是一种无需迭代即可计算输出权重的前馈神经网络,具有训练速度快、计算效率高等优势;Bi-GRU是从循环神经网络发展而来的一种变体,其结合了双向循环神经网络的鲁棒性和门控循环单元(GRU)的长序列处理能力[22],可高效地处理路基累积变形数据。

图1
神经网络算法
pic
1.2 累积塑性应变关系曲线

基于经验约束神经网络(empiricism-constrained neural network, ECNN)的高速铁路路基累积变形预测方法利用经验信息来提高神经网络模型的时间分布外泛化性。经验信息应从一般的经验理论中提取,这些经验理论可从试验或真实运营条件中得到。通常,高速铁路路基在列车循环荷载作用下,累积变形逐渐发展,累积塑性应变随振次增长[20]。在各种累积塑性应变关系曲线中,稳定型增长曲线模型适合于这一目的,因为在高速铁路实际工程中,稳定型累积塑性应变曲线最为常见[20],最具普适性。如图2所示,稳定型累积塑性应变曲线的增长过程可归纳为2个阶段:1) 初始快速增长阶段,即加载初期,应变增加快;2) 后期稳定阶段,即加载后期,应变的增长速率减缓或停滞,最终应变趋于稳定。

图2
稳定型累积塑性应变曲线
pic
1.3 基于经验约束神经网络的高速铁路路基累积变形预测模型

融合神经网络算法和累积塑性应变关系曲线,建立一种基于ECNN的高速铁路路基累积变形预测模型。首先,构建路基累积变形预测数据集,并划分数据集为训练集和测试集;其次,基于训练集建立神经网络模型,通过预测精度与误差、预测不确定性2个层次评价预测性能,从而确定最优神经网络预测模型;最后,利用最优神经网络模型驱动累积变形的数据信息,并以损失函数修正的方式嵌入累积塑性应变曲线,融入经验信息并实现对最优神经网络模型参数和损失函数的约束,完成ECNN模型构建。该模型的详细建立流程如图3所示,主要包括如下3个步骤。

图3
基于经验约束神经网络的高速铁路路基累积变形预测模型流程图
pic

步骤1:数据集构建与划分

基于工程现场或室内试验数据驱动,构建路基累积变形预测数据集D。按照8:2的比例将D划分为训练集Dtrain和测试集Dtest,训练集用于神经网络模型建立,测试集用于选择最优神经网络预测模型。

步骤2:最优神经网络预测模型确定

1) 基于训练集的神经网络模型建立

采用BP、ELM和Bi-GRU这3种典型的神经网络模型对高速铁路路基累积变形进行预测。在这3种典型的神经网络模型中,存在多种超参数,包括学习率、神经元个数、训练迭代次数等。为保障其预测精度,有必要寻找最优的超参数,故将训练集输入神经网络模型后,引入PSO算法[23]优化其超参数。

2) 基于测试集的神经网络模型优选

为确定最优的神经网络模型,得到在测试集上的预测结果后,通过预测精度与误差、预测不确定性2个层次评价预测性能,如表1所示。其中,使用拟合优度(pic)、平均绝对误差(fmae)和平均绝对百分比误差(fmape)这3个指标来评估预测精度和误差。预测结果不确定性分析从预测结果偏离中心程度、预测结果的显著性等角度,为神经网络模型性能比较提供了另一个重要依据;采用t统计检验(Tstat)、扩展不确定性(pic)、标准化平均差(fsmd)和fsi值对模型的预测不确定性进行分析。

表 1
预测性能评价体系
评价层次评价指标计算公式特点参考文献
预测精度与误差R2pic值越大精度越高[24]
fmae/mmpic值越小误差越小[25]
fmape/%pic值越小误差越小[25]
预测不确定性Tstatpic值越小显著性越小[26]
U95/mmpic值越小不确定性越小[26]
fsipicfsi<0.1卓越性能,fsi<0.2良好性能,fsi>0.3空气性能[26]
fsmd/mmpic值越小偏差越小[27]
展开更多

步骤3:ECNN模型训练与预测分析

1) ECNN模型训练

ECNN模型的网络结构如图4(a)所示。该模型的floss函数主要由数据驱动损失项和经验损失项2个部分组成。第1部分是基于最优神经网络模型所得的路基累积变形预测结果与实测路基累积变形值之间的偏差,记为flossdata,常采用均方误差fmse进行计算:

pic (1)

式中:pic为实测路基累积变形值;pic为路基累积变形预测值;pic为数据驱动损失项的训练样本总数。

图4
ECNN模型网络结构与ReLU函数的示意图
pic

第2部分是从稳定型累积塑性应变关系曲线中提取得到经验损失项flossemp,将其作为最优神经网络模型的约束。为符合稳定型累积塑性应变关系曲线的变化模式,路基累积变形应满足如下5个约束条件:

pic (2)pic (3)pic (4)pic (5)pic (6)

式中:路基累积变形的初始点应为0,故应满足pic;路基累积变形随着加载次数的增加而增大,故应满足pic;加载初期,路基累积变形增长快,速率可能随时间增长,故应满足pic;加载后期,路基累积变形增长减缓或停滞,应满足pic;在整个路基累积变形增长过程中,速率的梯度会随着时间的推移而减小,表现为pic

为确定加载初期与加载后期的分界点N1,利用文献调研手段,对国内外高速铁路路基累积变形领域的现场激振试验进行了总结,具体如表2所示。分析可知,现场总体激振次数绝大部分在200万次~300万次之间。当填料为AB组填料时,路基累积变形趋于稳定的激振次数在70万次~100万次之间;当填料为特殊土或改良土时,路基累积变形趋于稳定的激振次数在50万次~140万次之间。考虑各自范围的上限,可将100万次取为AB组填料条件下加载初期和加载后期的分界点,将140万次取为特殊土或改良土条件下加载初期和加载后期的分界点。

表 2
高速铁路路基现场激振试验
线路名称填料类型总体激振次数/万次趋于稳定的激振次数/万次参考文献
京沪高速铁路AB组填料25070[28]
云桂铁路膨胀土20050[29]
郑西客运专线AB组填料10075[30]
达成高速铁路红层泥岩300140[31]
某高速铁路改良红层泥岩20075[32]
红层泥岩200125[32]
达成高速铁路AB组填料200100[33]
京沪高速铁路AB组填料25070[34]
某高速铁路AB组填料350100[35]
某高速铁路AB组填料20090, 100[36]
达成高速铁路石灰稳定风化红泥岩30055[37]
展开更多

为满足上述5个约束条件,构建经验损失项flossemp如下:

pic (7)

式中:pic为路基累积变形预测值,ReLU为线性整流函数,上划线表示取算术平均值。关于ReLU的示意如图4(b)所示,若预测结果满足约束条件,则惩罚项为0,否则,惩罚项将与其大小成线性比例。

将经验损失项flossemp与数据驱动损失项flossdata加权求和,可得到损失函数:

pic (8)

式中:λ为权重参数,决定了flossemp在损失函数中的占比,对于floss值的控制尤为重要。为实现训练充分的目的,在损失函数计算过程中采用梯度迭代优化算法以最小化floss值,并同步更新神经网络的权重参数w和偏置向量b

pic (9)

式中:picpic为更新后的权重参数和偏置向量。

2) ECNN模型预测分析

完成ECNN模型训练后,分别从权重参数分析、预测性能评价与对比、时间分布外泛化性能验证3个方面分析ECNN模型的预测结果。

① 权重参数分析

从0到0.9,间隔0.1,分别设置不同的权重参数λ。输出在训练集上稳定后的损失值以及在测试集上picfmaefmape的计算值,通过比较这3个评价指标确定最佳权重参数,将其作为后续预测分析中的重要参数。

② 预测性能评价与对比

在最佳权重参数λ下,输出ECNN模型在测试集上的预测结果,从预测精度与误差、预测不确定性2个层次对比ECNN模型与最优神经网络预测模型的预测性能。

③ 时间分布外泛化性能验证

在最佳权重参数λ下,采用时间序列交叉验证(Time Series Cross-Validation, TSCV)对ECNN模型的时间分布外泛化性能进行验证。如图5所示,该方法保留时间序列顺序将数据集分为10组,每组的数据量占数据集D的10%,根据训练集和测试集的数据占比不同,得到了9种划分类型。以第1种(第1折)为例,采用数据集D的前10%作为训练集,剩余90%的数据作为测试集进行预测分析;其余划分类型中,每次将训练集占比向后扩充10%,对应测试集减少10%。

图5
时间序列交叉验证示意图
pic

2 案例分析

2.1 试验概况
2.1.1 工程概况

图6(a)所示,依托工点位于浙江省杭绍台高速铁路沿线里程DK86+130~DK86+160的路基试验段。在路基填筑完成后,借助大型激振器快速模拟高速列车循环荷载,激振试验的主要技术参数设置为:通过调节激振频率并结合基床表层动土压力盒反馈值的方式,确定激振频率为15 Hz。激振次数取为150万次~200万次时可满足高速铁路路基表面荷载的模拟要求[28],本研究中取为200万次。为监测循环荷载作用下的路基累积变形值,在加载板的对角上布设测点C-1和C-2,如图6(b)所示。

图6
路基试验段与测点布置
pic
2.1.2 路基累积变形监测结果

绘制激振试验过程中的路基累积变形规律如图7所示。分析可知,路基累积变形速率逐渐缓慢最后趋于稳定状态,这说明路基动应力小于其临界动应力,路基累积变形得到有效控制。当激振次数达到90万次,路基累积变形速率减小,逐渐趋于稳定,故N1应大于或等于90。由于本研究所依托工点的填料类型为AB组填料,将N1取为100。当激振次数达到200万次,加载板下路基累积变形为3.26 mm,说明高速列车循环荷载作用下路基压缩变形量相对较小,路基结构的动变形满足稳定需求。综上可判定该试验所得的路基累积变形符合稳定型曲线规律,并以C-1测点的数据作为数据集,开展后续的预测分析。

图7
路基累积变形监测结果
pic
2.2 最优神经网络模型确定
2.2.1 PSO参数优化结果

PSO算法优化各神经网络模型超参数过程中的适应度值变化规律如图8所示。分析可知,通过PSO算法的迭代优化,各模型的适应度显著降低,并均在20代之前趋于稳定。其中,Bi-GRU模型的适应度最低,一定程度上说明该模型更具优势。迭代完成后,将各神经网络模型的最优超参数保存后再次输入模型中,执行后续的最优神经网络模型优选操作。

图8
各模型适应度值随迭代次数变化
pic
2.2.2 最优神经网络模型优选结果

1) 预测精度与误差使用3个预测精度与误差评价指标对预测结果进行评估,总结计算结果于表3。各模型对路基累积变形都具有较强的预测能力,pic均值为0.951 31(高于0.9),fmape均值仅为0.219 17%。其中,预测性能最为突出的是Bi-GRU模型,其pic达到了0.972 59,其次分别是ELM模型和BP模型。

表 3
预测精度与误差指标计算结果
模型种类R2fmae/mmfmape/%
Bi-GRU0.972 590.005 320.167 56
ELM0.954 130.006 980.216 81
BP0.927 200.008 790.273 13
展开更多

绘制路基累积变形预测值与实测值对比散点图如图9(a)所示,图中的数据点越集中于45°中轴线则预测效果越好。分析可知,3种神经网络模型的预测效果均较好,基本上聚集在45°中轴线附近,且绝大多数点集中在10%的误差线内。为分析各模型预测值与实测值之间的误差,绘制残差分布如图9(b)所示。发现各预测模型的残差整体较小,主要集中在-0.02~0.02 mm。而Bi-GRU模型最聚集于0 mm处,其次分别是ELM模型和BP模型。为更好地区别出最优神经网络预测模型,需借助预测结果的不确定性分析来综合评定。

图9
预测结果散点对比与残差分布
pic

2) 预测不确定性计算得到预测的不确定性分析结果如表4所示。对比各模型的pic值可知,Bi-GRU模型的不确定性最低,pic仅为0.014 85。同时,由pic值表明,各模型的性能存在显著差异,其中差异性最小的是Bi-GRU模型。在Bi-GRU、ELM和BP模型中均观察到低于0.1的fsi值,表明各个模型在预测输出方面均性能优异,这与前述预测精度与误差评价结果一致。在fsmd值上,Bi-GRU模型最佳,fsmd=0.181 09,然后是ELM模型,最后是BP模型。综合预测精度与误差和预测不确定性的评价结果,可得Bi-GRU模型的综合性能最优,故将其作为最优神经网络模型,并与稳定型累积塑性应变曲线耦合后构建ECNN模型。

表 4
预测不确定性评价结果
模型种类U95/mmTstatfsmd/mmfsi
Bi-GRU0.014 8510.019 580.181 090.021 92
ELM0.015 8210.889 490.204 830.023 43
BP0.019 6810.917 510.242 340.029 38
展开更多
2.3 ECNN模型预测结果分析
2.3.1 权重参数λ分析结果

计算不同权重参数下ECNN模型在训练集的最终损失以及在测试集上的评价结果如表5所示,其中最优评价结果以粗体标出。分析可知,训练集的最终损失floss随着λ的增大而减小,表明权重参数的增大可以增加ECNN模型对于路基累积变形的拟合能力。相比之下,测试集上的评价结果是非单调的,当λ为0.3时,预测精度指标pic(0.989 03)最高,预测误差指标fmae(0.003 49 mm)和fmape(0.109 03%)最低。综上,确定ECNN模型的最优权重参数λ为0.3。

表 5
不同权重下训练集的最终损失与测试集评价结果
权重λflossdataflossempflossR2fmae/mmfmape/%
00.000 730.000 200.000 730.972 590.005 320.167 56
0.10.000 730.000 200.000 670.974 650.005 130.160 21
0.20.000 730.000 190.000 620.981 060.004 520.141 28
0.30.000 720.000 200.000 560.989 030.003 490.109 03
0.40.000 730.000 200.000 510.963 210.006 130.191 46
0.50.000 730.000 200.000 470.971 700.005 390.168 18
0.60.000 740.000 200.000 420.937 040.008 380.261 44
0.70.000 730.000 200.000 360.959 120.006 530.203 71
0.80.000 750.000 190.000 310.922 850.009 390.292 60
0.90.000 730.000 210.000 260.959 880.006 450.201 33
展开更多
注:flossdata, flossemp, floss这3项为训练集损失(稳定后);R2, fmae, fmape这3项为测试集评价指标。
2.3.2 预测性能评价与对比

绘制Bi-GRU模型与ECNN模型的全局分布对比如图10所示,图中的柱子表示在特定激振次数下的绝对误差,越高则表示误差越大。易知,Bi-GRU模型与ECNN模型均能反映实测路基累积变形值的走势,对比而言ECNN模型更为贴合。ECNN模型的绝对误差柱子高度约为Bi-GRU模型的一半,fmae仅为0.003 49 mm,改善了34.40%,表明ECNN模型在误差控制方面更优。

图10
Bi-GRU模型与ECNN模型的全局分布对比
pic

计算Bi-GRU与ECNN模型的预测性能对比结果如表6所示。由预测精度与误差层次可知,ECNN模型在预测精度指标pic与预测误差指标fmaefmape上均更优,展示了更强的预测性能。在预测不确定性层次上,picpicfsmd、fsi这4项不确定性指标分别改善了39.23%、73.49%、70.64%、47.72%,表明ECNN模型在预测不确定性方面具有更强的控制能力。综上可知,考虑经验约束的ECNN模型的预测性能优于Bi-GRU模型。

表6
Bi-GRU模型与ECNN模型的预测性能对比
评价层次评价指标Bi-GRUECNN
预测精度与误差R20.972 590.989 03
fmae/mm0.005 320.003 49
fmape/%0.167 560.109 03
预测不确定性U950.015 60.009 48
Tstat10.019 582.656 31
fsmd0.181 090.053 17
fsi0.021 920.011 46
展开更多
2.3.3 时间分布外泛化性能验证

采用TSCV方法测试并对比了Bi-GRU模型与ECNN模型的时间分布外泛化性能,得到不同的训练集长度下picfmaefmape的变化规律如图11所示。分析可知,当仅使用10%和20%的数据作为训练集时,Bi-GRU模型的预测精度较差,pic均低于0。而ECNN模型可以得到较为理想的预测结果,pic分别为0.764 74、0.832 05,fmae分别为0.121 17 mm、0.070 42 mm,fmape分别为4.187 43%、2.310 76%。当训练集的数据长度超过总体数据集的30%时,伴随路基累积变形趋于稳定阶段,Bi-GRU模型与ECNN模型在长期路基累积变形预测中均表现较好,但ECNN模型的预测性能始终优于Bi-GRU模型。

图11
时间序列交叉验证下各个评价指标的变化
pic

综上,当训练集覆盖的时间跨度较大时,Bi-GRU模型与ECNN模型均能较好地做出预测,因为稳定型曲线的路基累积变形最终会趋于平缓。而当训练集覆盖的时间跨度较小时,纯数据驱动的Bi-GRU模型完全失去预测能力,具有经验约束的ECNN模型表现更好。因此,当训练集覆盖的时间跨度较小时,ECNN模型可有效提高累积变形的预测精度。

3 讨论

3.1 ECNN模型长期预测分析

短期预测方法由于预测精度较高,目前在路基沉降预测、累积变形预测中得到广泛应用[38],而面向工程应用时,长期预测往往更有意义。为验证ECNN模型的长期预测性能,将测试集上的第1组时序样本输入,并采用滚动预测方法[11]对测试集上的路基累计变形进行预测分析。得到测试集上的长期预测结果后,采用fmaefmape评估其预测误差。绘制ECNN模型在测试集上的长期预测结果如图12(a)所示,并对比图10(b)中的短期预测结果。整体分析可知,ECNN模型的长期预测性能低于其短期预测性能,长期预测误差指标fmaefmape分别为0.009 01 mm、0.280 20%,但长期预测下的预测曲线与实测曲线的整体趋势较为贴合。进一步分析发现,在ECNN模型的长期预测过程中,ECNN模型对于前5个预测时间步的预测误差控制较好,绝对误差均低于0.01 mm;但随着预测时间步数的增加,预测误差逐渐增加,这主要由于每一步的预测都依赖于前一步的预测结果,导致了长期预测过程中的误差累积效应[39],进而影响整体预测精度。

图12
ECNN模型长期预测分析
pic

为验证ECNN模型对于路基累积变形突变点的适应能力,将突变点1和突变点2最近的一组时序样本输入,同样采用滚动预测的方法,向后预测5个时间步,绘制其结果如图12(b)和图12(c)所示。分析可知,2个突变点往后的短期预测误差较小,绝对误差均低于0.01 mm,fmae分别为0.003 45 mm和0.003 76 mm,一定程度上证明了ECNN模型在短期预测中对于突变点或拐点处预测误差的控制能力。

综上可知,短期预测与长期预测存在这样的关系,即短期预测性能优于长期预测,而高精度、高泛化的短期预测手段是长期预测的前提。建议以短期预测为主、长期预测为辅的方式开展路基累积变形的分析工作,以提供有效的预测结果。

3.2 ECNN模型未来研究展望

本研究融合神经网络算法和累积塑性应变关系曲线建立一种基于经验约束神经网络的高速铁路路基累计变形预测模型,有效提升了纯数据驱动模型的预测精度以及分布外泛化性能。但为进一步提升其工程意义和实用价值,为路基工程的灾害预测、预警提供理论支撑。未来的工作主要从如下2个方面展开。

1) 考虑模型参数动态更新的ECNN预测模型

为改善长期预测过程中的预测误差累积问题,有必要在既有ECNN模型的基础上考虑模型参数的动态更新。完成ECNN模型的训练后,在测试集或实际部署环境中进行滚动预测。在每一个预测时间步上计算其绝对误差,并与0.01 mm对比;如果在第i个时间步上的绝对误差小于0.01 mm,则继续预测直到满足条件;相反,则停止滚动预测并将其之前的时间步上所有预测值添加到输入序列中,并重新训练模型,然后从第i个时间步继续预测。

2) 考虑路基变形状态判识的ECNN预测模型

本研究的主要目标是提出一种基于经验约束神经网络的高速铁路路基累积变形预测方法,并验证该方法的基本框架和可行性。由于稳定型累积变形是高速铁路路基变形的主要形式之一,且最为常见和最具普适性,故首先选择了稳定型累积塑性应变曲线进行深入研究。与此同时,在构建ECNN模型时,需要一定的数据作为训练样本。由于稳定型累积变形数据相对较为丰富和易于获取,且具有较高的代表性,因此将该类型的数据作为研究基础,并依托工程案例开展分析。

参考TONG等[40]、管凌霄等[41]的研究成果,路基累积变形发展具有3种典型的形式,即稳定型、过渡型和破坏型。为进一步提升ECNN模型的实用性和推广应用价值,有必要提出一种考虑路基变形状态判识的ECNN预测模型,具体如图13所示。基于工程现场或试验获得高速铁路路基累积变形数据后,首先对曲线状态进行判识,以识别曲线类型;然后针对具体的曲线类型,例如稳定型、过渡型或破坏型,得到对应的经验信息约束条件,并以损失函数修正的方式嵌入到神经网络模型中;最后完成考虑路基变形状态判识的ECNN模型构建。

图13
考虑路基变形状态判识的ECNN预测模型
pic

4 结论

1) 所提基于经验约束神经网络的高速铁路路基累积变形预测方法包括最优神经网络预测模型确定、ECNN模型训练与预测分析2个部分。前者具有神经网络预测模型评价与优选功能,后者可构造具有时间分布外泛化性的高速铁路路基累积变形预测模型。

2) Bi-GRU模型的拟合优度pic达到0.972 59,扩展不确定性pic和标准化平均差fsmd仅为0.015 6、0.181 09,综合预测精度与误差、预测不确定性2个层次,确定Bi-GRU模型为最优的神经网络预测模型。

3) 相较于Bi-GRU模型,ECNN模型在预测精度与误差、预测不确定性2个层次均更优,表明考虑累积塑性应变关系(经验信息)约束的ECNN模型具备更强的预测性能。

4) 采用时间序列交叉验证方法,证实ECNN模型相较于Bi-GRU模型具有优异的时间分布外泛化性能,当训练集覆盖的时间跨度较小时,可有效提高累积变形的预测精度。ECNN模型短期预测性能优于长期预测,而高精度、高泛化的短期预测手段是长期预测的前提。为进一步提升其工程意义,未来研究工作建议考虑模型参数动态更新和路基变形状态判识。

参考文献
1冷伍明, 翟斌, 徐方, .

基于大型动三轴试验的粗粒土累积塑性应变概率模型研究

[J]. 振动与冲击, 2020, 39(15): 214-220.
百度学术谷歌学术
2王子昂, 王武斌, 苏谦, .

新建铁路大临线临沧站站场路基沉降评估分析

[J]. 铁道科学与工程学报, 2020, 17(7): 1688-1698.
百度学术谷歌学术
3钟志彬, 李安洪, 吴沛沛, .

红层软岩高速铁路路基长期上拱变形机理研究Ⅰ: 变形特征

[J]. 铁道科学与工程学报, 2023, 20(10): 3625-3637.
百度学术谷歌学术
4ZHANG Xutao, WANG Junyu, YIN Ruijie, et al.

Construction and application of regional multivariable settlement prediction model

[J]. Geotechnical and Geological Engineering, 2023, 41(8): 4529-4548.
百度学术谷歌学术
5MEI Huihao, LENG Wuming, NIE Rusong, et al.

Random distribution characteristics of peak dynamic stress on the subgrade surface of heavy-haul railways considering track irregularities

[J]. Soil Dynamics and Earthquake Engineering, 2019, 116: 205-214.
百度学术谷歌学术
6NIE Lei, WANG Hongfei, XU Yan.

Application of the arctangent function model in the prediction of ground mining subsidence deformation: a case study from Fushun City, Liaoning Province, China

[J]. Bulletin of Engineering Geology and the Environment, 2017, 76(4): 1383-1398.
百度学术谷歌学术
7SHIHABUDHEEN K V, PILLAI G N, PEETHAMBARAN B.

Prediction of landslide displacement with controlling factors using extreme learning adaptive neuro-fuzzy inference system (ELANFIS)

[J]. Applied Soft Computing, 2017, 61: 892-904.
百度学术谷歌学术
8SU Jie, WANG Yuzhe, NIU Xiaokai, et al.

Prediction of ground surface settlement by shield tunneling using XGBoost and Bayesian Optimization

[J]. Engineering Applications of Artificial Intelligence, 2022, 114: 105020.
百度学术谷歌学术
9CHEN Jing, LI Anyuan, BAO Chunyan, et al.

A deep learning forecasting method for frost heave deformation of high-speed railway subgrade

[J]. Cold Regions Science and Technology, 2021, 185: 103265.
百度学术谷歌学术
10BA Dejun, CHEN Guangwu, LI Peng.

Application of LS-PCP model based on EWM in predicting settlement of high-speed railway roadbed

[J]. Journal of Infrastructure Intelligence and Resilience, 2023, 2(2): 100037.
百度学术谷歌学术
11陈伟航, 罗强, 王腾飞, .

基于Bi-LSTM的非等时距路基工后沉降滚动预测

[J]. 浙江大学学报(工学版), 2022, 56(4): 683-691.
百度学术谷歌学术
12杨敏, 李然, 倪少权.

基于经济效益的高速铁路列车开行方案评价及调整

[J]. 铁道科学与工程学报, 2021, 18(11): 2824-2832.
百度学术谷歌学术
13ZHANG Qi, SU Qian, ZHANG Zongyu, et al.

Prediction of high-embankment settlement combining joint denoising technique and enhanced GWO-ν-SVR method

[J]. Journal of Rock Mechanics and Geotechnical Engineering, 2024, 16(1): 317-332.
百度学术谷歌学术
14丁建文, 魏霞, 高鹏举, .

基于GA-BP神经网络的软土路基运营期沉降预测

[J]. 东南大学学报(自然科学版), 2023, 53(4): 585-591.
百度学术谷歌学术
15RAISSI M, PERDIKARIS P, KARNIADAKIS G E.

Physics-informed neural networks: a deep learning framework for solving forward and inverse problems involving nonlinear partial differential equations

[J]. Journal of Computational Physics, 2019, 378: 686-707.
百度学术谷歌学术
16KARNIADAKIS G E, KEVREKIDIS I G, LU Lu, et al.

Physics-informed machine learning

[J]. Nature Reviews Physics, 2021, 3: 422-440.
百度学术谷歌学术
17VON RUEDEN L, MAYER S, BECKH K, et al.

Informed machine learning-A taxonomy and survey of integrating prior knowledge into learning systems

[J]. IEEE Transactions on Knowledge and Data Engineering, 2023, 35(1): 614-633.
百度学术谷歌学术
18SEL K, MOHAMMADI A, PETTIGREW R I, et al.

Physics-informed neural networks for modeling physiological time series for cuffless blood pressure estimation

[J]. NPJ Digital Medicine, 2023, 6(1): 110.
百度学术谷歌学术
19ZHANG Zilong, PAN Qiujing, YANG Zihan, et al.

Physics-informed deep learning method for predicting tunnelling-induced ground deformations

[J]. Acta Geotechnica, 2023, 18(9): 4957-4972.
百度学术谷歌学术
20龙尧, 张家生, 丁建源, .

粗粒土路基循环荷载试验及累积变形模型研究

[J]. 振动与冲击, 2017, 36(16): 128-133, 158.
百度学术谷歌学术
21梅慧浩, 冷伍明, 聂如松, .

粗粒土的动力行为特征及永久变形特性研究

[J]. 华中科技大学学报(自然科学版), 2019, 47(9): 113-119.
百度学术谷歌学术
22LI Xuechen, MA Xinfang, XIAO Fengchao, et al.

Time-series production forecasting method based on the integration of Bidirectional Gated Recurrent Unit (Bi-GRU) network and Sparrow Search Algorithm (SSA)

[J]. Journal of Petroleum Science and Engineering, 2022, 208: 109309.
百度学术谷歌学术
23SONG Baoye, WANG Zidong, ZOU Lei.

An improved PSO algorithm for smooth path planning of mobile robots using continuous high-degree Bezier curve

[J]. Applied Soft Computing, 2021, 100: 106960.
百度学术谷歌学术
24夏伟怀, 刘嘉莉, 冯芬玲.

基于随机森林的铁路冷藏运输需求预测

[J]. 铁道科学与工程学报, 2022, 19(4): 909-916.
百度学术谷歌学术
25徐光明, 林珊珊, 米希伟, .

高速铁路预售期旅客购票量分布预测

[J]. 铁道科学与工程学报, 2024, 21(1): 13-25.
百度学术谷歌学术
26HAMIDIAN P, ALIDOUST P, GOLAFSHANI E M, et al.

Introduction of a novel evolutionary neural network for evaluating the compressive strength of concretes: a case of Rice Husk Ash concrete

[J]. Journal of Building Engineering, 2022, 61: 105293.
百度学术谷歌学术
27ROSS R D, SHI Xu, CARAM M E V, et al.

Veridical causal inference using propensity score methods for comparative effectiveness research with medical claims

[J]. Health Services & Outcomes Research Methodology, 2021, 21(2): 206-228.
百度学术谷歌学术
28苏谦, 白皓, 黄俊杰, .

刚性地基低路堤长期动力特性原位试验研究

[J]. 土木工程学报, 2011, 44(S1): 147-151.
百度学术谷歌学术
29杨果林, 段君义, 杨啸, .

降雨与自然状态下膨胀土基床的振动特性

[J]. 浙江大学学报(工学版), 2016, 50(12): 2319-2327.
百度学术谷歌学术
30白皓, 苏谦, 黄俊杰, .

非埋式桩板路基动力特性原位激振试验研究

[J]. 岩土力学, 2012, 33(12): 3753-3759.
百度学术谷歌学术
31孔祥辉, 蒋关鲁, 邹祖银, .

循环荷载下红层泥岩的动力特性及路用性能研究

[J]. 岩石力学与工程学报, 2013, 32(9): 1813-1819.
百度学术谷歌学术
32徐鹏, 蒋关鲁, 任世杰, .

红层泥岩及其改良填料路基动力响应试验研究

[J]. 岩土力学, 2019, 40(2): 678-683,.
百度学术谷歌学术
33王智猛, 蒋关鲁, 魏永幸, .

高速铁路基床现场循环加载试验研究

[J]. 岩土力学, 2010, 31(3): 760-764.
百度学术谷歌学术
34郑键斌.

高速铁路桩板式低路堤动力响应特性研究

[D]. 成都: 西南交通大学, 2014.
百度学术谷歌学术
35吴波.

高速铁路不同细粒土基床底层结构动力特性测试分析

[J]. 铁道标准设计, 2008, 52(4): 63-65.
百度学术谷歌学术
36HUANG Junjie, SU Qian, LIU Ting, et al.

Vibration and long-term performance analysis of pile-plank-supported low subgrade of ballastless track under excitation loads

[J]. Shock and Vibration, 2015, 2015(1): 404627.
百度学术谷歌学术
37ZHANG Chonglei, JIANG Guanlu.

Full-scale model testing of the dynamic response of lime-stabilized weathered red mudstone subgrade under railway excitation

[J]. Soil Dynamics and Earthquake Engineering, 2020, 130: 105999.
百度学术谷歌学术
38徐长节, 丁海滨, 童立红.

列车荷载下软土路基长期沉降预测研究进展

[J]. 华东交通大学学报, 2021, 38(4): 1-7, 126.
百度学术谷歌学术
39仲悟之, 李崇钢, 崔杨, .

考虑历史相似性加权的超短期风电功率组合预测

[J]. 太阳能学报, 2022, 43(6): 160-168.
百度学术谷歌学术
40TONG Lihong, WU Bingni, LEI Zuxiang, et al.

Unified creeping model identifying the critical state of granular materials

[J]. Journal of Applied Physics, 2022, 132, 055105.
百度学术谷歌学术
41管凌霄, 童立红, 徐长节, .

基于状态演化模型的高铁路基动力累积沉降变形预测研究

[J]. 铁道科学与工程学报, 2024, 21(5): 1714-1725.
百度学术谷歌学术
注释

邓志兴,徐林荣,李永威等.基于经验约束神经网络的高速铁路路基累积变形预测研究[J].铁道科学与工程学报,2025,22(02):469-484.

DENG Zhixing,XU Linrong,LI Yongwei,et al.Research on subgrade cumulative deformation prediction of high-speed railway based on empiricism-constrained neural network[J].Journal of Railway Science and Engineering,2025,22(02):469-484.