logo

基于数据-知识协同驱动的轨道电路故障诊断策略

工程诊所•工匠之家

基于数据-知识协同驱动的轨道电路故障诊断策略

夏洋
晓锋
智宇
天剑
铁道科学与工程学报第21卷, 第12期pp.5276-5288纸质出版 2024-12-28
800

随着我国铁路运营规模的快速扩大,轨道电路及与其相互关联的铁路设备呈现爆发式增长,轨道电路维护难度日益增加。为满足轨道电路运营维护的市场需求,克服单一模型训练机制下难以充分挖掘多源状态监测数据反映的多维度失效特征信息的难题,基于轨道电路的工作原理和现有的监测数据,提出一种跨专业的数据-知识协同驱动的故障诊断策略。首先提出一种多源数据融合的故障诊断算法,进行数据级诊断决策。选取轨道电路本区段的功出电压及电流、发送端及接收端模拟网络电缆侧电压和电流、主轨出及小轨入电压、发送端及接收端调谐匹配单元E1E2处电流、发送端及接收端调谐匹配单元V1V2处电流作为多源特征量,采用SMOTE数据增强算法解决各故障模式下数据样本分布不平衡的问题,利用基于CatBoost的多特征集成学习算法初步构建轨道电路故障诊断模型,并采用网格搜索算法和10-折交叉验证法对故障诊断模型的超参数优化,实现轨道电路系统故障区域定位和故障类型识别。在此基础上,结合多专业监测数据,根据专家知识进行知识级专家决策,实现轨道电路系统跨专业故障诊断。最后将该算法用于ZPW-2000A轨道电路系统进行算例分析,实现了轨道电路系统跨专业的故障诊断,验证了该算法的有效性。研究结果为解决轨道电路跨专业故障诊断提供了有效的解决方案,推动了维修模式向预防性“状态修”转变的进程。

故障诊断数据驱动跨专业轨道电路铁路信号基础装备

铁路信号系统的集成化、信息化、智能化水平不断提升,包含轨道电路系统在内的信号基础装备将在更为复杂的气候环境和电磁环境条件下运行,对信号设备的安全可靠性、可用性及可维修性提出了更为严格的要求。作为铁路运输系统中的重要组成部分,信号基础装备的正常运行对保障列车运行安全和高效至关重要。然而,在长期的使用过程中,信号基础装备也难免会出现各种各样的故障,给运营带来一定的影响和困扰。针对工业系统的故障诊断,国内外的专家学者已开展了大量的研究工作,故障诊断方法可分为基于模型的故障诊断、基于数据的故障诊断和基于知识的故障诊断[1]。基于模型的故障诊断方法通过研究系统的工作机理,构建数学模型,系统运行过程中发生故障时,参数会发生变化,比较模型参数与运行参数,当两者差值超过某一阈值时,即认为系统发生故障,该故障诊断方法可以根据少量的实时数据实现故障诊断[2]。钟麦英等[3]提出一种鲁棒故障检测与反馈控制的最优集成设计方法,解决了同时满足闭环控制系统设计要求和故障诊断系统鲁棒性能的最优集成设计问题;YE等提出了一种新的基于奇偶关系的残差生成器及其优化方法,通过低阶奇偶向量和简单的在线实现形式,确保良好的性能指标、低误检测率和适当的故障响应速度[4]。这类方法的诊断准确性很大程度上依赖于模型的准确性,对于复杂和高集成化系统,需要考虑的因素较多,且运行工况复杂,难以建立准确的数学模型,很难起到良好诊断效果[5]。基于数据的故障诊断则利用机器学习、信号处理方法对监测系统产生的大量历史数据进行处理,提取表征故障的数据模式,建立起数据输入与诊断输出之间的映射关系模型,通过将实际运行的实时数据输入所建立的预测模型来输出故障诊断结果,可通过提供给现场人员的一些有用的统计数据和计算推理信息来改善过程监控系统的性能,因此近年来国内外学者针对铁路信号设备提出大量基于数据的故障诊断算法。李新琴等[6]提出基于组合权重计算方法下的BiGRU和BiLSTM的深度集成模型,实现信号道岔设备故障数据智能诊断分类;陈永刚等[7]通过分析研究转辙机运行时产生的振动信号,提出了一种基于动态权重粒子群算法优化自适应神经模糊网络的转辙机故障诊断方法;杨菊花等[8]基于CSM中道岔的故障电流和功率曲线,提出一种基于哈尔小波变换、卷积神经网络和门控循环单元的道岔故障诊断算法,并通过实验仿真验证算法性能。聚焦轨道电路设备,LIU等[9]提出了一种考虑隐患对铁路安全影响的故障诊断方法,该方法基于不同危害的风险评估来定义安全相关故障的类型,选择径向基函数核建立支持向量机预测模型,并通过差分进化算法优化参数;BRUIN等[10]提出使用长短期记忆循环神经网络及时检测和识别轨道电路故障,利用深度置信网络(deep belief network, DBN)强大的特征提取能力,对每一层的受限玻尔兹曼机逐层进行无监督训练,挖掘数据内部特征并降维;朱文博等[11]以C4.5决策树为基本单元,引入粗糙集中属性核与相对约简的概念消除冗余特征,构建轨道电路故障诊断组合网络模型;WANG等[12]针对补偿电容的长期准确健康管理问题,提出了一种基于卷积神经网络和双向长短期记忆改进的深度神经网络算法。这类方法需要训练大量的历史数据,需要较高的计算成本,而且过度依赖历史样本数据,对未知故障类型的诊断效果差[13]。另一方面,上述基于数据的故障诊断方法在单一模型训练机制下尚未充分挖掘多源状态监测数据反映的多维度失效特征。在此基础上,集成学习方法已被证明为提高预测准确性,将复杂、困难的学习问题分解为更简单的子问题的有效方法[14],同时结合各方法的优势、研究多策略融合的故障诊断模型已成为未来技术的发展趋势。基于知识的故障诊断方法是利用国际或国家标准、行业技术规范等的知识以及专家在长期工作实践中所积累的经验知识对故障现象进行定性分析的方法[15-16]。吕婷等[17]设计了一种基于故障树和贝叶斯网络的混合诊断专家系统,有效解决了传统诊断专家系统存在的推理模式单一、知识获取困难等问题,为复杂系统的故障诊断提供了一种新途径;谭洁等[18]对铁路车站信号设备故障诊断专家系统的知识库进行设计分析,提高预防修和状态修的水平。这类方法以对设备原理的了解与掌握程度以及专家的工作经验为基础进行故障位置的定位,过于依赖对设备故障机理的认知把握和经验,拓展性和普遍性较低。综上所述,现有的铁路信号设备故障诊断方法各有优缺点,因此可以融合以上的多种故障诊断方法用于故障诊断,充分利用其优点,即,混合的故障诊断方法。此外,目前的研究侧重单系统的故障诊断,对于铁路信号设备与工务、电务、供电多专业接口处的跨专业故障诊断问题成为铁路运营的一大难题[19-20]。鉴于现有铁路运输系统的监测诊断技术对于跨专业的故障诊断等问题仍未形成有效解决方案,本文选定轨道电路这一安全苛求铁路信号基础装备,通过引入其他专业的监测数据,提出一种数据-知识协同驱动的故障诊断策略。该方法融合了数据驱动的机器学习技术和基于领域知识的专家推理,不仅提高了故障识别的准确性和系统的泛化能力,而且增强了诊断结果的可解释性。通过整合多源监测数据和跨专业专家知识,该策略能够有效地实现对复杂故障模式的综合分析和精确定位,从而促进预防性维护策略的实施,优化决策过程,并最终提升铁路系统的可靠性和安全性。另一方面,针对现有轨道电路诊断方法在单一模型训练机制下尚未充分挖掘多源状态监测数据反映的多维度失效特征,对轨道电路的故障定位也不够精细化的现状,本文引入一种被证明为提高预测准确性,可将复杂、困难的学习问题分解为更简单的子问题的有效方法—集成学习算法,提出创新的故障诊断模型和方法,旨在进一步加快铁路信号设备向着基于检测、监测和大数据分析的预防性“状态修”的转变步伐。

1 ZPW-2000A型无绝缘移频轨道电路

图1所示为ZPW-2000A型无绝缘轨道电路系统的系统结构图,ZPW-2000A轨道电路采用电气绝缘节来实现相邻轨道电路区段的隔离,由室内设备和室外设备组成。室内设备主要有发送器、接收器、衰耗器、站防雷、电缆模拟网络盘及继电器组合构成。室外设备主要由调谐单元、空芯线圈、匹配变压器、补偿电容、传输电缆、调谐设备引接线构成。

图1
ZPW-2000A轨道电路系统结构图
pic

车辆段内轨道电路分为无岔区段轨道电路和道岔区段轨道电路。无岔区段轨道电路内钢轨没有分支,结构简单,用于停车线、检车线、尽头线调车信号机接近区段,以及2个差置调车信号机之间的线路。道岔区段轨道线路结构比较复杂,包含了岔前线路、岔后直向位置线路和岔后侧向位置线路。根据道岔结构,不仅有关钢轨、杆件要增加绝缘,还要增加道岔跳线和连接线,当分支超过一定长度时,还必须设置多个受电端。因此,道岔区段轨道电路的运行状态与道岔密切相关。

ZPW-2000A无绝缘轨道电路的工作状态和电气特性的监测主要由轨道电路监测维护系统及室外监测系统完成,主要监测点包括发送器设备功出端、发送端电缆模拟网络电缆侧或设备侧、接收端电缆模拟网络电缆侧或设备侧、接收器输入端、衰耗器输入端、发送端及接收端调谐匹配单元E1E2处、发送端及接收端调谐匹配单元V1V2处,监测值包括功出电压、功出电流、发送端模拟网络电缆侧电压、发送端模拟网络电缆侧电流、发送端调谐单元E1E2处电流、发送端调谐单元V1V2处电流、接收端调谐单元E1E2处电流、接收端调谐单元V1V2处电流、接收端模拟网络电缆侧电压、接收端模拟网络设备侧电压、主轨出电压、小轨入电压。

为实现轨道电路系统的跨专业故障诊断,还引入道岔监测诊断系统的监测数据,包括道岔扳动信息、道岔缺口值、转换阻力、表示杆位移、基本轨及尖轨的横向和纵向位移等。

2 数据-知识协同驱动的故障诊断策略

2.1 多源监测特征数据集构建
2.1.1 故障模式定义

选取ZPW-2000A型轨道电路为数据采集对象,基于第1节所介绍的轨道电路监测系统,对能够完整、有效地反映轨道电路信号传输状态的12个关键参数,展开电压或电流有效值的实时监测及动态采集。根据上述12个关键参数,可定位到29种轨道电路可靠性和安全性相关的精细化故障模式及正常模式,具体定义如表1所示,其中“目标值”表示各“故障模式”在有监督学习训练中的对应标签值(即类别编号)。

表1
轨道电路精细化故障模式定义
目标值故障模式目标值故障模式目标值故障模式
0接收端BA0(零阻抗)有断线11接收端模拟网络有短路22发送端SVA有短路
1接收端BA0 (零阻抗) 有短路12接收端轨面有短路23发送端TAD有断线
2接收端BAP(极阻抗)有断线13所有位置均正常24发送端TAD有短路
3接收端BAP(极阻抗)有短路14补偿电容有断线25发送端实际SPT电缆有断线
4接收端SVA有断线15补偿电容有短路26发送端实际SPT电缆有短路
5接收端SVA有短路16轨出有断线27发送端模拟网络有断线
6接收端TAD有断线17发送端BA0(零阻抗) 有断线28发送端模拟网络有短路
7接收端TAD有短路18发送端BA0(零阻抗) 有短路29发送端轨面有短路
8接收端实际SPT电缆有断线19发送端BAP(极阻抗)有断线
9接收端实际SPT电缆有短路20发送端BAP(极阻抗)有短路
10接收端模拟网络有断线21发送端SVA有断线
展开更多
2.1.2 数据预处理及模型验证机制

机器学习允许计算机通过“学习”得到数据的数字表示与某些目标值之间的关系,且Python中集成了全面、开源的机器学习包Scikit-learn。因此本文基于Python及Scikit-learn实现故障智能诊断,其实质是以故障模式作为目标值的分类算法。通过将从轨道电路监测系统所得的用于模型训练和测试的数据按照图2所示的数据张量结构整理数据完成数据预处理。

图2
ZPW-2000A轨道电路系统结构图数据张量结构定义
pic

此外,训练的过程中使用K折交叉验证法(K-fold cross-validation, K-CV)预测模型的拟合水平,以有效避免欠拟合和过拟合的发生,且使预测结果更具说服力[21]。K-CV流程如图3所示,具体地,将原始数据均分成K组,并将每个子集数据分别依次作为验证集,其余的K-1组子集数据作为训练集,进而得到K个模型,并将这K个模型最终的验证集的平均分类精度Ecv作为此K-CV下分类器的性能指标。下文中均采用K=10时的K-CV评估模型拟合精度。

图3
K-CV流程图
pic
2.1.3 基于SMOTE算法的数据增强

本文数据中轨道电路状态数据共含1类正常模式及29类故障模式,数据集样本总量为28 415,其中各组状态数据样本存在类间分布不平衡的问题,即:部分类别数据样本量过小,同时存在部分类别数据样本量远大于其他类,造成有监督训练模型一定程度的性能损失。进而,将“样本量小”的数据统称为少数类样本,而“样本量大”的数据则统称为多数类样本,为解决实际监测样本数据上述“类间不平衡”导致有监督学习任务中分类界面偏移这一问题,本文采用SMOTE(Synthetic Minority Oversampling Technique)算法对数据进行过采样处理[22],通过补充少数类样本以达到样本数据均衡的目的,如图4所示。

图4
SMOTE算法示意图
pic

具体地,对于少数类的样本pic,选择其K个最邻近的少数类样本pic,在picpic的连接线上插入新的合成少数类样本pic,如式(1)所示,其中picpic范围内的随机变量。

pic(1)

基于Python环境中Scikit-learn库集成SMOTE算法,设置随机种子pic(用于控制随机数生成的种子,以确保每次实验结果的一致性),经新样本扩充后的样本平衡结果如表2所示。

表2
样本平衡结果
数据类型多数类样本少数类样本多数类占比/%少数类占比/%比例
样本平衡前3 45638390109∶1
SMOTE平衡后3 4563 45650501∶1
展开更多

可见,经上述过采样平衡处理后少数类样本数量得以扩充,使得分类模型能够更好地学习少数类特征,进而提高对少数类样本的分类性能;鉴于过采样方法通过合成新的样本而并非简单复制已有样本,从而进一步丰富少数类样本的多样性,不易造成过拟合;同时,此类过采样处理在合成新的少数类样本时并不依赖于多数类样本,因此不会引入对多数类的任何偏见。

2.2 基于CatBoost的多特征集成学习算法

集成学习模型依据某种组合策略,通过组合多个弱监督模型以期得到一个更好更全面的强监督模型,能够在很大程度上纠正弱监督模型的错误决策,进而达到更高的精确度[23],其基本框架如图5所示,即通过结合多个模型的平均输出,提高模型的稳定性和泛化能力。具体来看,同种并行生成各个基模型的集成策略属于Bagging方式,除此之外,Boosting则通过串行训练和加权结合多个模型,以提高整体的训练精度和预测能力。

图5
集成学习模型的基本框架
pic

本文采用Boosting算法作为集成学习框架,以串行迭代方式训练基学习器,并将前一个基学习器的预测结果应用于后一个基学习器的训练,使得基学习器之间存在依赖关系。该分类机制下的具体工作流程如图6所示。

图6
Boosting算法流程图
pic

在此基础上,CatBoost (Categorical Boosting) 基于梯度提升决策树(Gradient Tree, GBDT)算法框架,利用损失函数的负梯度值来近似计算残差[24]以对称决策树(Oblivious Tree)为基学习器,为有效解决梯度提升中的预测偏移问题,在避免模型过拟合的同时提升模型准确性与泛化性能,形成CatBoost算法核心策略如下。

1) 类别型特征处理:采用目标变量统计(Target Statistics, TS)处理类别型特征,将替换后的类别标签平均值作为决策树构建过程中节点分裂的标准,即Greedy TS(Greedy Target-based Statistics),通过添加先验分布项来降低噪声、低频类别型数据对数据分布的影响,则优化后的Greedy TS为:

pic(2)

其中,pic为大于0的权重系数;pic为添加的先验项,常设置为数据集中标签均值。

2) 贪心策略:在为当前树构建新的分裂节点时,把当前树的所有组合、类别特征同数据集中全部的类别特征进行结合,同时把新的类别组合型特征动态地转换为数值型特征。

3) 排序提升理论:对于训练样本集pic,首先将其按照所生成的pic随机序列pic进行排列;假定树的棵数为pic,初始化模型pic;对于每一棵树的构建,遍历每个样本,对前pic个样本以此计算梯度,利用前pic个样本的梯度以及pic来训练模型pic;对每一个样本pic,用pic来修正pic;遍历、迭代后获得最终模型pic

4) 对称决策树:采用完全对称树及完全二叉树,依据相同的分割准则,该平衡树结构能够同时提升训练速度并有效避免过拟合。

2.3 基于网格搜索的模型超参数优化

对于基于CatBoost算法框架构建的ZPW-2000A轨道电路故障诊断模型,实际模型拟合性能与其超参数的选择与设置有很强的依赖关系。CatBoost算法的关键超参数(Hyper-parameter)如表3所示,其中,D表示树的深度,其支持值的范围取决于处理单元类型和所选损失函数的类型;L表示代价函数的L2正则化项的系数;迭代次数N表示可以建立的最大树数(当未使用其他限制迭代次数的参数时)。此外,学习率R可根据数据集属性和N自动定义,用于减小梯度步长,且默认情况下自动定义的值接近最佳值,因此不做单独优化。

表3
样本平衡结果CatBoost超参数寻优空间
参数名称参数含义寻优空间
D树的深度[4,10],步长1
LL2正则化系数[0.1,1],步长0.02
N迭代次数(最大树数)[100,1 000],步长100
展开更多

超参数被用于建立模型时控制算法行为,无法从正常的训练过程中学习,必须在训练模型前被分配[25]。GridSearchCV为Scikit-learn中集成的自动调参工具,包括网格搜索(GridSearch)和交叉验证(CV)2部分,前者在指定的参数范围内,按步长依次调整并训练,从而精准找到在验证集上精度最高的参数;后者用于进一步提升模型泛化性能,为模型配置最优的超参数组合。综上,本文采用集成网格搜索算法和10-折交叉验证(见图3)的GridSearchCV完成对轨道电路故障诊断模型的超参数优化,结果如表4所示。

表4
CatBoost最优超参数配置
参数名称最优值
D10
L0.14
N1 000
展开更多
2.4 基于专家知识推理的协同决策

在上述多源数据融合故障诊断算法基础上,引入失效特征演化逻辑推理相关专家知识集,协同驱动实现多维度、跨专业的轨道电路系统综合故障诊断。整体方法如图7所示,首先基于轨道电路自身的监测数据,利用多源数据融合的故障诊断方法,实现轨道电路的故障定位;然后结合跨专业监测数据(如道岔监测数据,属于工务专业监测,不同于轨道电路监测所属的电务专业),根据专家知识库信息,进一步确定故障致因。在前面多源数据融合故障诊断算法处理的基础上,结合知识库中的内容和规则,可便于后续对故障原因进行推理判断,提升对未进行数据模型训练故障类型的识别,提升故障诊断系统的故障诊断准确率和故障定位精细化程度。

图7
数据-知识协同驱动的故障诊断算法流程图
pic

专家知识库是来自国际或国家标准、行业技术规范等的知识以及基于轨道电路系统原理、工作特点、系统接口方式等运用场景的专家经验知识,其中专家经验知识包括:1) 轨道电路系统工作原理相关经验知识,如:小轨道检查条件缺失→接收器不工作→区段状态占用、编码条件错误→接收器不工作→区段状态占用、低频编码错误→发送器不工作→区段状态占用、通信失效→通信状态缺失→区段状态占用、单台接收器脱离电路→小轨电压上升、接收端零阻抗故障→小轨电压大幅上升、调谐设备故障→同时影响相邻区段主轨电压、仅小轨电压异常→衰耗设备故障等;2) 轨道电路工作特点相关经验知识,如:主备发送器均无输出电流→主发送器故障、运行方向信息错误→监测数据错误、传感器采集故障→监测数据错误、发送端通道断线→功出电流大幅上升等;3) 轨道电路系统接口方式相关经验知识,如:电源接口故障→整柜设备不工作、通信板接口故障→整柜设备不工作、列控中心接口故障→整柜设备不工作、列控中心采集故障→单区段状态占用、钢轨机车信号电流低→车载掉码、钢轨接地→电压波动、防雷单元劣化→区段状态占用、道床漏泄→多区段电压降低、机械绝缘节破损→两相邻区段电压变化、道岔转换设备启动→区段状态占用等。

3 实验验证

本节选取了28415组能反映出表5所列的ZPW-2000A轨道电路正常工作和29种故障类型且不冗余的样本数据,数据来源为第1节所介绍的轨道电路监测系统,旨在应用本文提出的基于CatBoost的多特征集成学习算法,完成基于实际监测数据的轨道电路故障诊断,验证方法的工程可行性和有效性。其中,每组样本数据都由功出电压、功出电流、发送端模拟网络电缆侧电压、发送端模拟网络电缆侧电流、发送端调谐单元E1E2处电流、发送端调谐单元V1V2处电流、接收端调谐单元E1E2处电流、接收端调谐单元V1V2处电流、接收端模拟网络电缆侧电压、接收端模拟网络设备侧电压、主轨出电压、小轨入电压这12个监测值组成。依据图2定义的模型训练中每组数据的张量结构,表5分别给出了正常工作和29种故障类型对应的一组数据。

表5
故障数据示例
目标值故障模式功出电压/V功出电流/A发送端模拟网络电缆侧电压/V发送端模拟网络电缆侧电流/A发送端匹配单元E1E2电流/A发送端匹配单元V1V2电流/A接收端匹配单元V1V2电流/A接收端匹配单元E1E2电流/A接收端模拟网络电缆侧电压/V接收端模拟网络设备侧电压/V主轨出电压/V小轨入电压/V
0接收端BA0(零阻抗)有断线160.0840.331135.440.3070.35712.0583.990.0314.2741.2920.2780.233
1接收端BA0(零阻抗)有短路159.4760.344133.1320.3210.37110.1285.330.0425.711.7260.3720.199
2接收端BAP(极阻抗)有断线159.9510.354133.8360.3240.35811.742000000.247
3接收端BAP(极阻抗)有短路160.2060.344135.0150.3150.35312.445000000.255
4接收端SVA有断线159.7330.338134.160.3140.36610.954.6110.0364.9391.4930.3220.212
5接收端SVA有短路159.6880.355133.0550.3270.36510.8813.2470.0253.4781.0510.2270.229
6接收端TAD有断线159.3830.345132.870.3220.3749.8476.02700000.193
7接收端TAD有短路159.4750.358132.3410.3310.3710.2143.1230.1520000.217
8接收端实际SPT电缆有断线159.4290.343133.0930.3210.3739.9996.1190.0160000.194
9接收端实际SPT电缆有短路159.5330.349132.9770.3240.36910.3033.9310.080000.21
10接收端模拟网络有断线159.5280.341133.4830.3180.37110.3176.0080.0422.35000.199
11接收端模拟网络有短路159.5140.346133.1090.3220.3710.2384.7380.0482.265000.204
展开更多

评估有监督学习性能依据的评价指标为精确率pic、召回率pic和二者的调和平均值pic,分别如式(3)~(5)所示,其中,picpicpic分别表示真阳性、假阳性及假阴性预测结果。

pic(3)pic(4)pic(5)

此外,采用混淆矩阵(Confusion Matrix)可视化评估分类模型性能。具体地,混淆矩阵由pic方阵构成,其中行向量代表样本真实所属类别,列向量代表样本预测类别,即混淆矩阵第pic行第pic列的元素表示实际归属于类别pic但却被预测为类别pic的样本数量。

进而,基于2.1节预处理及增强后的多源监测数据集,按7:3比例划分为训练集和测试集,采用第2.3节优化后的集成学习模型完成故障诊断训练及拟合性能验证。结果显示,训练精度为97.1%,测试精度为94.2%,学习率R随迭代次数N变化曲线如图8所示。

图8
学习率随迭代次数变化曲线
pic

此外,为了证明本文提出的基于CatBoost的多特征集成学习算法的优势,将上述样本数据分别经过随机森林算法与卷积神经网络算法训练,训练结果见表6,显然采用本文提出的集成学习算法所得到的模型具有更高的训练精度和测试精度,证明该方法更具优势。

表6
不同算法性能对比
故障诊断算法训练精度/%测试精度/%
基于CatBoost的多特征集成学习算法97.194.2
随机森林92.388.1
卷积神经网络91.185.9
展开更多

本文集成学习模型具体的性能指标结果如表7所示(均保留两位小数),对应的混淆矩阵可视化如图9所示,图中矩阵数值元素表示预测结果符合对应位置的标签的数量,右侧色阶栏规定了矩阵中每个格子的颜色和对应的概率。

表7
故障诊断模型性能评价结果
性能评价指标得分
pic0.94
pic0.94
pic0.94
展开更多
图9
故障诊断模型预测输出的混淆矩阵
pic

图9清晰直观地展示出第4节构建的集成模型对包含有30种不同状态/故障模式的测试集样本的预测输出与诊断效果,可见,基于CatBoost的多特征集成学习算法在共30 454个测试集样本上,对于精细化定义后的故障模式均有着较高的诊断准确率,其中“接收端TAD有断线”“轨出有断线”等11种故障模式实现了约100%的精准预测;对其余各类故障模式的诊断准确率也均达到了94%。鉴于标准性技术文件TJ/DW 197-2017《ZPW-2000区间轨道电路室外监测及诊断系统暂行技术条件》规定系统配置室外采集设备条件下的诊断系统应具备覆盖“11点监测”的故障分区定位功能,不同于既有区段级、设备级等较粗颗粒度下的故障诊断研究,本文针对轨道电路完整传输环节定义的精细化故障模式(即表1)下的精准诊断预测,可更适用于上述技术条件要求。此外,对于“接收端BA0(零阻抗)有断线”“接收端BA0(零阻抗)有短路”“接收端轨面有短路”等故障模式,模型预测错误率相对较高,分析与故障模式定义过于精细、数据特征差异性不明显有关,不同于2.1.3小节中基于样本均衡策略的SMOTE数据增强,后续可通过针对性监测数据集扩充来进一步提高此类样本预测精度。

在数据级诊断决策的基础上,引入道岔扳动信息,进行轨道电路主轨短路致因判断。对于被诊断为故障模式15的数据,如果道岔发生了扳动,则认为该故障是由道岔扳动引起的短路导致的,否则认为是补偿电容短路引起的。通过与标记数据对比,该模式下的故障诊断准确率达到94%。

4 结论

1) 针对轨道电路系统的特性,提出一种数据-知识协同驱动的故障诊断方法。首先提出了一种多源数据融合的故障诊断算法实现了对轨道电路系统29种故障的有效识别,然后结合跨专业监测数据和专家知识,进一步挖掘出故障致因,实现了跨专业的故障诊断。

2) 通过实验验证了相比于现有的轨道电路诊断系统的“11点监测”故障分区定位功能,不仅提升了轨道电路故障诊断的精细化程度,而且识别出了道岔对轨道电路的影响。

3) 本文提出的方法进一步推动了轨道电路向着基于监测和大数据分析的预防性“状态修”的进程,但是对于故障区域定位的精细化程度有待进一步提升,如传输电缆及补偿电容故障的具体位置等。

参考文献
1王秋实.

ZPW-2000A型无绝缘移频轨道电路智能故障诊断方法研究

[D]. 成都: 西南交通大学, 2017.
百度学术谷歌学术
2FRANK P M.

Analytical and qualitative model-based fault diagnosis-A survey and some new results

[J]. European Journal of Control, 1996, 2(1): 6-28.
百度学术谷歌学术
3钟麦英, 张承慧, Steven X Ding.

一种鲁棒故障检测与反馈控制的最优集成设计方法

[J]. 自动化学报, 2004, 30(2): 294-299.
百度学术谷歌学术
4YE Hao, WANG Guizeng, DING S X.

A new parity space approach for fault detection based on stationary wavelet transform

[J]. IEEE Transactions on Automatic Control, 2004, 49(2): 281-287.
百度学术谷歌学术
5LIANG J, DU R.

Model-based fault detection and diagnosis of HVAC systems using support vector machine method

[J]. International Journal of Refrigeration, 2007, 30(6): 1104-1114.
百度学术谷歌学术
6李新琴, 张鹏翔, 史天运, .

基于深度学习集成的高速铁路信号设备故障诊断方法

[J]. 铁道学报, 2020, 42(12): 97-105.
百度学术谷歌学术
7陈永刚, 许继业, 王海涌, .

基于自适应神经模糊网络的转辙机故障诊断方法

[J]. 吉林大学学报(工学版), 2023, 53(11): 3274-3280.
百度学术谷歌学术
8杨菊花, 于苡健, 陈光武, .

基于CNN-GRU模型的道岔故障诊断算法研究

[J]. 铁道学报, 2020, 42(7): 102-109.
百度学术谷歌学术
9LIU Chang, CHU Shaotong, YANG Shiwu, et al.

Fault diagnosis of impedance match bond in high-speed railway concerning risk assessment

[C]// International Conference on Electrical and Information Technologies for Rail Transportation. Singapore: Springer, 2022: 409-420.
百度学术谷歌学术
10DE BRUIN T, VERBERT K, BABUSKA R.

Railway track circuit fault diagnosis using recurrent neural networks

[J]. IEEE Transactions on Neural Networks and Learning Systems, 2017, 28(3): 523-533.
百度学术谷歌学术
11朱文博, 王小敏.

基于组合决策树的无绝缘轨道电路故障诊断方法研究

[J]. 铁道学报, 2018, 40(7): 74-79.
百度学术谷歌学术
12WANG Conghui, YANG Shiwu, LIU Chang.

A novel health state prediction approach based on artificial intelligence combination strategy for compensation capacitors in track circuit

[J]. The Journal of Supercomputing, 2024, 80(8): 11661-11681.
百度学术谷歌学术
13LI Yihuan, LI Kang, YIN Mingjia, et al.

Advances in fault diagnosis for high-speed railway: a review

[C]// 2019 6th International Conference on Frontiers of Industrial Engineering (ICFIE). London, UK. IEEE, 2019: 67-72.
百度学术谷歌学术
14KRAWCZYK B, MINKU L L, GAMA J, et al.

Ensemble learning for data stream analysis: a survey

[J]. Information Fusion, 2017, 37: 132-156.
百度学术谷歌学术
15GAO Zhiwei, CECATI C, DING S X.

A survey of fault diagnosis and fault-tolerant techniques—part II: fault diagnosis with knowledge-based and hybrid/active approaches

[J]. IEEE Transactions on Industrial Electronics, 2015, 62(6): 3768-3774.
百度学术谷歌学术
16GAO Zhiwei, CECATI C, DING S X.

A survey of fault diagnosis and fault-tolerant techniques—part I: fault diagnosis with model-based and signal-based approaches

[J]. IEEE Transactions on Industrial Electronics, 2015, 62(6): 3757-3767.
百度学术谷歌学术
17吕婷, 杨涛.

融合多种算法的堆垛机诊断专家系统

[J]. 自动化仪表, 2018, 39(1): 12-15, 19.
百度学术谷歌学术
18谭洁, 张友鹏.

铁路信号设备故障诊断专家系统知识库的研究

[J]. 铁道运营技术, 2011, 17(1): 1-3, 6.
百度学术谷歌学术
19李夏洋.

轨道电路智能运维技术

[J]. 铁路通信信号工程技术, 2023, 20(S1): 84-86, 110.
百度学术谷歌学术
20贾鸿, 马樱, 张祺.

25 Hz相敏轨道电路与ZPW-2000A结合处的逻辑检查故障分析

[J]. 铁路通信信号工程技术, 2024, 21(3): 101-105.
百度学术谷歌学术
21PENG Jinglun, KIM M J, JO M H, et al.

Accuracy evaluation of the crop-weather yield predictive models of Italian ryegrass and forage rye using cross-validation

[J]. Journal of Crop Science and Biotechnology, 2017, 20(4): 327-334.
百度学术谷歌学术
22谢桦, 陈俊星, 赵宇明, .

基于SMOTE和决策树算法的电力变压器状态评估知识获取方法

[J]. 电力自动化设备, 2020, 40(2): 137-142.
百度学术谷歌学术
23徐凯, 郑浩, 涂永超, .

改进麻雀算法和Q-Learning优化集成学习轨道电路故障诊断

[J]. 铁道科学与工程学报, 2023, 20(11): 4426-4437.
百度学术谷歌学术
24FRIEDMAN J H.

Greedy function approximation: a gradient boosting machine

[J]. The Annals of Statistics, 2001, 29(5): 1189-1232.
百度学术谷歌学术
25刘栋财, 董广宇, 杜玉红, .

基于网格搜索算法的6-RUS并联机器人时间最优轨迹规划

[J]. 中国机械工程, 2023, 34(13): 1589-1598.
百度学术谷歌学术
注释

李夏洋,刘倡,杨晓锋等.基于数据-知识协同驱动的轨道电路故障诊断策略[J].铁道科学与工程学报,2024,21(12):5276-5288.

LI Xiayang,LIU Chang,YANG Xiaoyfeng,et al.A fault diagnosis strategy for track circuits based on data-knowledge collaboratively driven[J].Journal of Railway Science and Engineering,2024,21(12):5276-5288.