转辙机作为铁路道岔转换的关键信号设备,常年工作于室外,其服役性状直接影响到列车运行的可靠性与安全性,是运维工作的重点关注对象[1-2]。目前,集中监测系统能够实时采集道岔转换时转辙机的动作电流和功率数据,并将其与预设参考曲线进行对比,实现基于阈值的故障报警。由于转辙机受外界环境影响,其故障模式多样,使得监测系统的误报率和虚警率较高[3],目前还需要人工对报警进行分析和故障类别确认,其准确率依赖于工作人员的专业经验且处置效率低,难以满足现场设备的状态修要求。因此,开展智能化的转辙机故障诊断成为了近年来的研究热点。随着大数据与深度学习技术的发展,基于数据驱动的转辙机故障诊断方法已经成为研究主流[2-12],这些方法大体上可以分为监督学习和无监督学习两大类别。监督学习依赖已标注的数据来指导模型训练,并将故障诊断任务视为分类问题。例如,WANG等[2]针对转辙机不同动作阶段的数据,提取最大相关性和最小冗余度特征,并结合极限学习机分类器进行故障分类。WEN等[4]将转辙机动作曲线转换为图像格式,并应用卷积神经网络 (CNN)训练 LeNet-5模型以实现故障诊断。赵盼等[5]依托元学习片段式训练模式下的双层优化机制及贝叶斯元学习对模型不确定性的度量,实现小样本训练下的诊断模型。杨菊花等[8]将转辙机电流和功率数据经小波变换预处理后,通过CNN提取故障特征以作为门控逻辑单元(GRU)的输入,从而实现故障诊断。郑启明等[9]通过改进生成对抗网络来训练模型,在扩充训练样本空间的同时增强分类网络的损失权重,实现了小样本故障诊断中更优异的性能。虽然这些监督学习方法在实验环境中表现出色,但实际应用中,监测数据标签的缺失及高昂的人工标注成本限制了这些方法的应用[3]。针对数据标签稀缺问题,无监督学习方法通过自编码器等技术挖掘数据潜在特征,并利用聚类等手段总结故障模式,将故障诊断视为模式识别任务。例如,GUO等[3]采用深度自编码器挖掘故障模式,并通过投票策略集成模型提高了故障诊断精度。SOARES等[11]通过假设检验和无监督特征提取计算损伤指数以预测转辙机的潜在故障。尽管无监督学习模型解决了数据标签稀缺问题,但因其在训练过程中缺少与任务相关的指导信息,其诊断效果相较于监督学习模型存在较大差距[13-14]。此外,我国铁路现场使用的转辙机型号多样,而现有研究多针对单一型号建模[5],缺乏跨型号数据应用的探索。考虑到不同型号转辙机数据之间的异同,如何融合多型号设备数据以解决单一型号设备故障样本稀缺,是一个值得研究的问题。对比表示学习[15](Contrastive Learning Representation, CLR)在训练阶段利用代理任务(pretext task)来分析批次数据间的相似性,以代替传统的数据标签来指导训练。该方法已成功应用于无标签目标识别领域[15-16],并在数据区分能力和泛化能力方面展现出与监督学习相近的性能。考虑到相同故障类型的转辙机数据通常显示出一致的全局模式特征,具有内在相似性。理论上,随着包含多种故障类型的转辙机数据样本集合增大,集合内2个最相似样本属于同一故障类别的概率亦相应提高。鉴于此,本文提出一种基于自监督对比表示学习的转辙机故障诊断方法,在训练过程中识别批次数据中两两最相似样本配对,并将各样本对视为同一故障类型以推导任务知识,以解决无标签模型在训练中缺乏任务指导的问题。本文的主要工作包括:1) 考虑到转辙机动作曲线与设备服役性状紧密相关,将一维时域功率数据转换为二维空间域干涉图像,以便CNN网络捕捉数据的时序动态;2) 利用CNN自编码器提取数据的潜在编码,并通过编码与数据间映射关系分析数据相似性;3) 使用潜在编码构建CLR代理任务,将批次数据中最相似样本对视作正样本,其他样本则视为负样本;4) 构建对比损失函数以指导表示学习,通过正负样本对促进高相似性数据特征的聚合和低相似性数据特征的分离;5) 通过所学习的表示特征进行故障模式挖掘,并结合一个分类器网络作为下游任务实现故障诊断。实验结果表明,本文方法在故障诊断性能上优于无监督学习模型,并与监督学习模型相当。此外,本文对比表示方法依据数据固有的相似性关系来指导训练过程,所学习的表示不受人为定义标签的影响。因此,该方法能够支持多样化的下游任务,具有较高的工程实用性潜力,为转辙机故障诊断工程化应用提供了一种新的解决方案。
1 转辙机监测数据及故障模式分析
道岔是一种使列车从一股道转入另一股道的线路连接系统,主要由岔轨和转辙机构成,如图1所示。转辙机在变轨区通过动力牵引改变尖轨位置,使原来密贴的斥离、原来斥离的密贴,从而改变轨道走向。转辙机转换道岔的动作过程可以简单分为2个步骤:1) 表示电路监测接口检测到1DQJ继电器吸起,动作曲线检测接口启动A/D转换以收集电流与功率数据,同时触发执行电路工作,道岔开始转换;2) 道岔转换完成后,1DQJ继电器缓放,执行电路停止工作,动作曲线接口停止A/D转换。

在上述转辙机动作过程中,牵引电机的动作电流将呈现阶段性变化趋势。现场维护经验表明,当启动异常、转换超时、锁闭卡组等故障发生时,将会导致动作电流和功率数据的时序动态发生相应改变。在道岔转换过程中,监测电路以不大于40 ms的采样周期,通过控制模拟量输入板上的多路开关对该道岔动作电流进行密集采样,并发送至监控主机。通过监测分析动作电流或功率的变化情况,一定程度上可以实现转辙机常见故障的诊断。图2列举了正常和7种常见异常动作曲线(类型1~7),为方便叙述,下文将正常动作曲线记为类型0,其他故障类型记为类型1~7。为了进一步阐述动作曲线与转辙机故障模式之间的关联,表1列出了每种异常曲线对应的故障类型及根因。

类别 | 故障类型 | 原因 |
---|---|---|
1 | 转换卡阻 | 转换过程存在机械卡阻 |
2 | 解锁峰值过高 | 转辙机内部部分机械部件缺油有摩卡现象,或锁闭框调整不当 |
3 | 解锁超时 | 转辙机内部存在电机减速器、传动部分、机械转换部位卡阻或滑床板不良问题 |
4 | 转换异常 | 转换时间过短,缓放区由于断相保护器出现故障,可能为故障维修后第一次转换 |
5 | 动作区电流功率值过 大及锁闭卡阻 | 自动开闭器的拐轴卡滞,动接点不能顺利脱离静接点;或转辙机转换部件机械卡滞 |
6 | 转换区功率过高 | 锁闭部件有磨损,接点接触不良 |
7 | 启动异常且动作与 锁闭区卡阻 | 转辙机箱外或箱内卡阻,如齿条块落异物、零件错位、减速器内部行星齿轮卡阻或别卡、部件缺油锈蚀等 |
2 基于自监督表示学习的转辙机故障诊断方法
该故障诊断方法包含2个核心步骤:首先,通过自监督表示学习模型从监测数据中提取其表示特征;随后,依托所学习的表示特征,利用聚类算法识别数据包含的故障模式,并训练下游分类器网络以实现故障诊断任务。
2.1 转辙机监测数据预处理
转辙机动作曲线具备时序依赖性,其时序动态特征表现为特定的变化趋势。在深度学习应用中,目前主要采用2种策略提取时序动态:一种通过建模方法提取时序特征;另一种将动作曲线图像化处理后利用卷积神经网络(CNN)提取模式特征。虽然前者可以利用领域知识设计高效的数据特征表达,但这种方法受限于浅层表达的泛化能力,增加了深度学习模型过拟合的风险;相比之下,后者能够自动学习复杂的特征表示,但其性能受限于时间序列图像化方法的合理性。本文采用格拉姆角场(Gramian Angular Field, GAF)技术[17-18]将时序数据转换为干涉图像,以在二维平面上反映数据的周期性和全局趋势,有效保留了转辙机动作曲线的时序动态信息。通过采用GAF技术预处理,能够增强动作曲线的时序动态的图像化表征,从而提高模型的特征提取效率。
设转辙机动作曲线为

式(1)中:

其中,

2.2 正负样本构建
对比表示学习的代理任务通常依赖于数据增强方法,诸如变换、拉伸、裁减和添加噪声等,生成训练批次数据
2.2.1 转辙机监测数据自编码网络
根据式(3),经过GAF预处理后,标准化的转辙机动作曲线

式中:

式(5)中:

2.2.2 基于自编码网络的正负样本构建
考虑到同故障类型转辙机的数据具备内在相似性,其相应自编码

进一步计算批次内两两样本的相似度:

对第

其中,

式中:
2.3 转辙机监测数据对比表示学习
本文对比表示学习模型命名为AE-CLR (Autoencoder based contrastive learning of representations),其总体结构如图4所示。该模型通过嵌入网络

其中,

在对比表示学习过程中,通过

式(11)中:
2.4 转辙机故障诊断方法
AE-CLR模型通过对比表示学习提取数据的表示特征,并在此基础上通过下游任务实现故障诊断功能。该下游任务通过一个由全连接层和SoftMax输出层构成的分类器网络

式中:
3 实验分析
3.1 实验数据集
为验证本文模型在无标签场景下的故障诊断能力,本研究采集了广州铁路局现场多个ZDJ9与ZYJ7型转辙机设备的真实故障数据进行实验分析,相关数据见表2。
型号 | 编号 | 数据类别 | 训练样本量 | 测试样本量 |
---|---|---|---|---|
ZDJ9 | 0 | 正常数据 | 731 | 100 |
ZDJ9 | 1 | 转换卡阻 | 128 | 100 |
ZDJ9 | 2 | 解锁峰值过高 | 108 | 100 |
ZDJ9 | 3 | 解锁超时 | 171 | 100 |
ZDJ9 | 4 | 转换异常 | 89 | 100 |
ZDJ9 | 5 | 动作区功率值过大及锁闭卡阻 | 72 | 100 |
ZDJ9 | 6 | 转换区功率过高 | 122 | 100 |
ZDJ9 | 7 | 锁闭区卡阻 | 105 | 100 |
ZYJ7 | 0 | 正常数据 | 30 | 0 |
ZYJ7 | 1 | 转换卡阻 | 30 | 0 |
ZYJ7 | 7 | 锁闭区卡阻 | 30 | 0 |
ZYJ7 | 8 | 动作时间短 | 13 | 0 |
3.2 实验方法及评价指标
本文AE-CLR模型将故障诊断任务视为分类问题,重点在于利用对比学习机制在表示学习阶段聚合同一故障类型的不同表示,并在此基础上通过分类器网络将表示转换为分类标签编码。实验采用现场真实ZDJ9型转辙机训练数据集训练模型,并使用同型号测试数据集验证故障诊断效果,具体实验过程如下。



3.3 实验环境及超参数分析
本文实验在PyTorch 2.01框架下进行,其主要硬件配置包括Nvidia GeForce RTX2060显卡和Intel(R) Core i7-9750H @ 2.6GHz 处理器。
本文AE-CLR模型在表示学习阶段采用对比学习范式增强表示特征性能,此过程主要关注3个关键超参数:训练批次样本量
为了评估模型超参数对训练效果的影响,通过ZDJ9训练集对AE-CLR模型进行训练,并在ZDJ9测试集上评估了其故障诊断性能。图5呈现了20次实验的故障诊断F1分数平均值及其标准偏差。其中,温度系数

图6给出了基于所选超参数的模型训练损失曲线。训练集和验证集的损失值均展现出良好的收敛性,经过80次迭代后趋向稳定,没有明显的过拟合或欠拟合现象,表明AE-CLR模型的训练过程有效。

3.4 消融实验分析
为了验证本文AE-CLR模型对比学习机制及相应的正负样本策略的贡献,对比了4种模型学习到的表示特征在数据区分方面的性能。作为基准,选取了未集成对比学习机制的无监督与监督自动编码器。此外,引入基于对比学习的SimCLR模型[15],它通过向数据注入信噪比为0.8的椒盐噪声来生成正样本,通过对比SimCLR来分析本文代理任务的效果。图7展示了采用t-SNE算法降维后的表示特征,以分析4种模型表示在潜在空间中的分布情况。结果显示,监督自编码器借助标签指导训练,其表示对不同类型的数据呈现明显区分。与之相比,无监督自编码器在第3类和第4类数据的表示上出现重叠,缺乏明显界限。尽管SimCLR模型采用了对比学习策略,但其表示仍然显示出重叠现象,这表明该模型的数据增强策略对转辙机数据的表示学习效果有限。相较之下,AE-CLR模型的表示呈现不同类别数据的簇状分布。特别是,正常数据(类型0)的表示在潜在空间中分成了两簇,这一现象主要源于道岔正向与反向转换在动作曲线上的差异性。

为进一步定量评估图7中表示特征在数据区分能力方面的性能,本文采用DBSCAN算法对4种模型学习到的表示进行聚类,相应结果见表3。在表3中,同质性用于衡量簇内元素是否仅来自单一类别;完整性则评估了给定类别的所有成员是否被归于同一簇;Fowlkes-Mallows指数(FMI)是准确率和召回率的几何平均,用于评价聚类结果与真实故障类型的一致性。结果显示,监督自编码器在所有指标都接近1,这表明其学习到的表示特征与相应故障类型高度匹配,形成一一对应的簇。相比之下,无监督自动编码器和SimCLR在同质性与FMI上表现不佳,反映了其表示分布存在重叠,影响了表示区分数据的能力。AE-CLR在同质性和FMI方面仅次于最优表现,表明其表示的分布上不存在重叠。然而,由于该模型进一步区分出正常数据的道岔正向和反向转换,形成2个簇,导致完整性指标有所下降。该实验证实了AE-CLR模型能够通过对比学习机制及其相应的代理任务有效地学习转辙机各故障类型的表示特征。
3.5 故障诊断性能对比分析
为了进一步分析本文AE-CLR模型的故障诊断性能,选择了4种最近发表的转辙机故障诊断方法进行对比。为了有效评估模型的诊断性能,实验统一采用Adam优化器调整对比模型参数,学习率设置为10-3,训练批次样本量N=400,DAE与AE-CLR模型中自编码、表示编码维度为16,AE-CLR中温度系数为0.2。对比实验结果如表4所示。
由于现场收集的转辙机真实故障数据有限,用于测试的ZDJ9型设备各类故障数据仅有100条。如表4所示,在此小规模的测试集下,AE-CLR的诊断准确率达到了99.63%,不排除其在更大规模测试集上准确度有所下降的可能性。在不依赖数据标签的情况下,AE-CLR在准确率、召回率以及F1值方面的表现略次于基于ACGAN的监督学习方法,并超越了CNN-LeNet5和CNN-GRU监督学习方法。此外,与无监督学习DAE方法相比,AE-CLR表现出明显的诊断性能提升。
为进一步评估融合数据集对表示学习过程的泛化能力及其对DAE和本文AE-CLR故障诊断性能的影响,在实验步骤1中将ZDJ9和ZYJ7型训练集数据混合作为融合训练集,以扩充表示学习的训练样本分布;随后在步骤4中仅使用ZDJ9型数据的表示特征以挖掘其数据类型,其他步骤保持不变。具体的实验数据构成参见表2,鉴于ZDJ9和ZYJ7型转辙机数据之间的差异性,融合训练集未能增强监督学习模型的诊断效果,CNN-LeNet5等其他3个监督模型的诊断性能存在不同程度的下降。同时,无监督DAE方法的诊断性能也下降了4.34%。相比之下,本文AE-CLR模型在融合训练集下的故障诊断性能获得提升,并且在相同条件下超越所有监督学习方法。这一结果体现了AE-CLR模型在泛化学习方面的优势,通过融合不同类型的转辙机数据进行训练,可以在一定程度上增强训练效果,从而缓解现场转辙机故障样本稀缺的问题。
4 结论
1) 针对铁路转辙机型号多样性、故障样本稀缺性以及数据标注缺失等挑战,提出一种基于自监督表示学习的转辙机故障诊断方法。该方法无需大量有标签的数据进行训练,即可实现与监督学习模型相当的故障诊断性能。
2) 与传统的监督学习模型相比,本文方法依据数据间的固有相似性关系来指导训练过程,其表示学习性能不受人为定义标签变动的影响。因此,该表示学习方法能够支持多样化的下游任务,具有较高的工程实用性潜力。
3) 实验结果表明,采用单一型号转辙机数据进行模型训练后,故障诊断的准确率可达99.63%。当融合多型号转辙机数据进行训练时,模型的准确率进一步提升至99.88%,具有优秀的故障诊断性能。
Big self-supervised models are strong semi-supervised learners
[EB/OL]. 2020: arXiv: 2006.10029. http://arxiv.org/abs/2006.10029.郑启明,王小敏,江磊.基于无标签自监督表示学习的转辙机故障诊断方法研究[J].铁道科学与工程学报,2025,22(01):404-415.
ZHENG Qiming,WANG Xiaomin,JIANG Lei.An unlabeled self-supervised fault diagnosis method for switch machines based on contrastive learning of representations[J].Journal of Railway Science and Engineering,2025,22(01):404-415.