logo

基于无标签自监督表示学习的转辙机故障诊断方法研究

工程诊所•工匠之家

基于无标签自监督表示学习的转辙机故障诊断方法研究

启明
小敏
铁道科学与工程学报第22卷, 第1期pp.404-415纸质出版 2025-01-28
400

转辙机是铁路系统中控制道岔转换的关键信号设备,准确诊断其工作状态对列车的行车安全和可靠至关重要。鉴于现场数据常缺乏标签且故障样本少,提出一种基于自监督表示学习的转辙机故障诊断方法。该方法首先将转辙机动作曲线转换为图像形式,随后通过自编码器提取数据的潜在特征。然后,基于同故障类型转辙机数据具有内在相似性,设计了一种表示学习模型,该模型通过比较批次数据间的相似关系来监督训练过程,实现高相似性数据的表示分布聚合,从而挖掘数据的潜在分类结构。此外,得益于对比学习的泛化优势,该方法能够利用不同类型转辙机的数据来增强模型训练效果。最终,通过聚类挖掘表示特征中的故障模式,并训练下游分类网络分类表示特征,从而实现不依赖人工标记数据的故障诊断模型。研究结果表明,相较于传统自编码器,对比表示学习模型可以更有效地区分不同故障类型的转辙机监测数据。在无标签训练模型的情况下,采用ZDJ9型转辙机现场数据训练模型后,在测试数据集上故障诊断准确率为99.63%,融合ZDJ9型和ZYJ7型转辙机现场数据训练模型后,故障诊断准确率提升到99.88%,比传统无监督学习模型准确率提升了8个百分点,并与监督学习模型性能相当。该方法结合了无监督模型不依赖人工标记数据和监督模型故障诊断准确率高的优势,为铁路现场转辙机故障诊断提供了一种新的可行方案。

转辙机故障诊断自监督对比学习表示学习

转辙机作为铁路道岔转换的关键信号设备,常年工作于室外,其服役性状直接影响到列车运行的可靠性与安全性,是运维工作的重点关注对象[1-2]。目前,集中监测系统能够实时采集道岔转换时转辙机的动作电流和功率数据,并将其与预设参考曲线进行对比,实现基于阈值的故障报警。由于转辙机受外界环境影响,其故障模式多样,使得监测系统的误报率和虚警率较高[3],目前还需要人工对报警进行分析和故障类别确认,其准确率依赖于工作人员的专业经验且处置效率低,难以满足现场设备的状态修要求。因此,开展智能化的转辙机故障诊断成为了近年来的研究热点。随着大数据与深度学习技术的发展,基于数据驱动的转辙机故障诊断方法已经成为研究主流[2-12],这些方法大体上可以分为监督学习和无监督学习两大类别。监督学习依赖已标注的数据来指导模型训练,并将故障诊断任务视为分类问题。例如,WANG等[2]针对转辙机不同动作阶段的数据,提取最大相关性和最小冗余度特征,并结合极限学习机分类器进行故障分类。WEN等[4]将转辙机动作曲线转换为图像格式,并应用卷积神经网络 (CNN)训练 LeNet-5模型以实现故障诊断。赵盼等[5]依托元学习片段式训练模式下的双层优化机制及贝叶斯元学习对模型不确定性的度量,实现小样本训练下的诊断模型。杨菊花等[8]将转辙机电流和功率数据经小波变换预处理后,通过CNN提取故障特征以作为门控逻辑单元(GRU)的输入,从而实现故障诊断。郑启明等[9]通过改进生成对抗网络来训练模型,在扩充训练样本空间的同时增强分类网络的损失权重,实现了小样本故障诊断中更优异的性能。虽然这些监督学习方法在实验环境中表现出色,但实际应用中,监测数据标签的缺失及高昂的人工标注成本限制了这些方法的应用[3]。针对数据标签稀缺问题,无监督学习方法通过自编码器等技术挖掘数据潜在特征,并利用聚类等手段总结故障模式,将故障诊断视为模式识别任务。例如,GUO等[3]采用深度自编码器挖掘故障模式,并通过投票策略集成模型提高了故障诊断精度。SOARES等[11]通过假设检验和无监督特征提取计算损伤指数以预测转辙机的潜在故障。尽管无监督学习模型解决了数据标签稀缺问题,但因其在训练过程中缺少与任务相关的指导信息,其诊断效果相较于监督学习模型存在较大差距[13-14]。此外,我国铁路现场使用的转辙机型号多样,而现有研究多针对单一型号建模[5],缺乏跨型号数据应用的探索。考虑到不同型号转辙机数据之间的异同,如何融合多型号设备数据以解决单一型号设备故障样本稀缺,是一个值得研究的问题。对比表示学习[15](Contrastive Learning Representation, CLR)在训练阶段利用代理任务(pretext task)来分析批次数据间的相似性,以代替传统的数据标签来指导训练。该方法已成功应用于无标签目标识别领域[15-16],并在数据区分能力和泛化能力方面展现出与监督学习相近的性能。考虑到相同故障类型的转辙机数据通常显示出一致的全局模式特征,具有内在相似性。理论上,随着包含多种故障类型的转辙机数据样本集合增大,集合内2个最相似样本属于同一故障类别的概率亦相应提高。鉴于此,本文提出一种基于自监督对比表示学习的转辙机故障诊断方法,在训练过程中识别批次数据中两两最相似样本配对,并将各样本对视为同一故障类型以推导任务知识,以解决无标签模型在训练中缺乏任务指导的问题。本文的主要工作包括:1) 考虑到转辙机动作曲线与设备服役性状紧密相关,将一维时域功率数据转换为二维空间域干涉图像,以便CNN网络捕捉数据的时序动态;2) 利用CNN自编码器提取数据的潜在编码,并通过编码与数据间映射关系分析数据相似性;3) 使用潜在编码构建CLR代理任务,将批次数据中最相似样本对视作正样本,其他样本则视为负样本;4) 构建对比损失函数以指导表示学习,通过正负样本对促进高相似性数据特征的聚合和低相似性数据特征的分离;5) 通过所学习的表示特征进行故障模式挖掘,并结合一个分类器网络作为下游任务实现故障诊断。实验结果表明,本文方法在故障诊断性能上优于无监督学习模型,并与监督学习模型相当。此外,本文对比表示方法依据数据固有的相似性关系来指导训练过程,所学习的表示不受人为定义标签的影响。因此,该方法能够支持多样化的下游任务,具有较高的工程实用性潜力,为转辙机故障诊断工程化应用提供了一种新的解决方案。

1 转辙机监测数据及故障模式分析

道岔是一种使列车从一股道转入另一股道的线路连接系统,主要由岔轨和转辙机构成,如图1所示。转辙机在变轨区通过动力牵引改变尖轨位置,使原来密贴的斥离、原来斥离的密贴,从而改变轨道走向。转辙机转换道岔的动作过程可以简单分为2个步骤:1) 表示电路监测接口检测到1DQJ继电器吸起,动作曲线检测接口启动A/D转换以收集电流与功率数据,同时触发执行电路工作,道岔开始转换;2) 道岔转换完成后,1DQJ继电器缓放,执行电路停止工作,动作曲线接口停止A/D转换。

图1
转辙机及集中监测系统框图
pic

在上述转辙机动作过程中,牵引电机的动作电流将呈现阶段性变化趋势。现场维护经验表明,当启动异常、转换超时、锁闭卡组等故障发生时,将会导致动作电流和功率数据的时序动态发生相应改变。在道岔转换过程中,监测电路以不大于40 ms的采样周期,通过控制模拟量输入板上的多路开关对该道岔动作电流进行密集采样,并发送至监控主机。通过监测分析动作电流或功率的变化情况,一定程度上可以实现转辙机常见故障的诊断。图2列举了正常和7种常见异常动作曲线(类型1~7),为方便叙述,下文将正常动作曲线记为类型0,其他故障类型记为类型1~7。为了进一步阐述动作曲线与转辙机故障模式之间的关联,表1列出了每种异常曲线对应的故障类型及根因。

图2
正常及常见故障数据示例,各类别包含6组功率数据
pic
表1
常见故障动作曲线类型及根因分析
类别故障类型原因
1转换卡阻转换过程存在机械卡阻
2解锁峰值过高转辙机内部部分机械部件缺油有摩卡现象,或锁闭框调整不当
3解锁超时转辙机内部存在电机减速器、传动部分、机械转换部位卡阻或滑床板不良问题
4转换异常转换时间过短,缓放区由于断相保护器出现故障,可能为故障维修后第一次转换
5

动作区电流功率值过

大及锁闭卡阻

自动开闭器的拐轴卡滞,动接点不能顺利脱离静接点;或转辙机转换部件机械卡滞
6转换区功率过高锁闭部件有磨损,接点接触不良
7

启动异常且动作与

锁闭区卡阻

转辙机箱外或箱内卡阻,如齿条块落异物、零件错位、减速器内部行星齿轮卡阻或别卡、部件缺油锈蚀等
展开更多

2 基于自监督表示学习的转辙机故障诊断方法

该故障诊断方法包含2个核心步骤:首先,通过自监督表示学习模型从监测数据中提取其表示特征;随后,依托所学习的表示特征,利用聚类算法识别数据包含的故障模式,并训练下游分类器网络以实现故障诊断任务。

2.1 转辙机监测数据预处理

转辙机动作曲线具备时序依赖性,其时序动态特征表现为特定的变化趋势。在深度学习应用中,目前主要采用2种策略提取时序动态:一种通过建模方法提取时序特征;另一种将动作曲线图像化处理后利用卷积神经网络(CNN)提取模式特征。虽然前者可以利用领域知识设计高效的数据特征表达,但这种方法受限于浅层表达的泛化能力,增加了深度学习模型过拟合的风险;相比之下,后者能够自动学习复杂的特征表示,但其性能受限于时间序列图像化方法的合理性。本文采用格拉姆角场(Gramian Angular Field, GAF)技术[17-18]将时序数据转换为干涉图像,以在二维平面上反映数据的周期性和全局趋势,有效保留了转辙机动作曲线的时序动态信息。通过采用GAF技术预处理,能够增强动作曲线的时序动态的图像化表征,从而提高模型的特征提取效率。

设转辙机动作曲线为pic,其中pic表示pic时刻的功率值。通过式(1)pic标准化,确保其值域被限定在区间pic

pic (1)

式(1)中:pic代表pic时刻的标准化功率值。利用式(2)pic映射至极坐标空间:

pic (2)

其中,pic表示pic在极坐标空间中的角度。本文采用GASF(Gramian Angular Summation Field)矩阵构建干涉图像特征[17]

pic (3)
2.2 正负样本构建

对比表示学习的代理任务通常依赖于数据增强方法,诸如变换、拉伸、裁减和添加噪声等,生成训练批次数据pic中样本pic的多个视角pic作为正样本,同时将pic定义为负样本,其中pic表示批次数据的总量。该策略的目标是增强模型的泛化能力,并提升其在特征表示上的区分力。然而,转辙机动作曲线的时序动态与设备服役性状紧密相关,上述数据增强手段破坏了数据的本征物理属性,不利于目标数据的表示学习。考虑到自编码器在自动提取数据潜在结构方面的高效性,以及相同故障类型转辙机数据的内在相似性,本文提出了一种新的代理任务。该任务利用自编码为pic识别其最相似数据pic,并将pic视为正样本,而将pic pic视为负样本,并利用训练批次的随机洗牌确保模型的泛化能力。

2.2.1 转辙机监测数据自编码网络

根据式(3),经过GAF预处理后,标准化的转辙机动作曲线pic由一维时间序列映射到二维空间,得到全局时序动态的干涉图像pic。随后,通过CNN自编码器提取pic中的时序动态特征,得到关于picpic维的自编码pic。本文CNN自编码器由编码器pic和解码器pic2部分构成,网络结构如图3所示,其中KSP分别代表卷积层和池化层中的卷积核大小、步长以及边缘填充。图3中,CNN网络层的横轴表示输入通道数,纵轴表示二维输入数据的维度。编码器pic和解码器pic的映射可以描述为:

pic (4)

式中:picpic代表自编码器网络的参数集。为了得到最优pic参数集,采用嵌入还原损失pic来指导CNN自编码器的训练过程:

pic (5)

式(5)中:pic表示均方误差(MSE)。

图3
自编码器网络结构
pic
2.2.2 基于自编码网络的正负样本构建

考虑到同故障类型转辙机的数据具备内在相似性,其相应自编码pic亦具备高相似性。根据这一原理,在一个足够大的自编码集合pic中,对于任一pic,都存在一个与pic最相似的表示pic,且picpic所对应的输入picpic属于同一潜在类的概率最大。基于此,设在对比表示学习训练过程中,每个训练批次由集合pic组成,其中pic表示第pic个样本。集合pic表示pic通过pic得到的自编码集合。样本间的距离关系可以由下式得到:

pic (6)

进一步计算批次内两两样本的相似度:

pic (7)

对第pic个样本与其他样本之间的相似度进行归一化处理:

pic (8)

其中,pic表示pic在批次数据中的相对相似关系,则记pic的正样本pic为:

pic (9)

式中:pic表示与pic相似度最高的样本,即,pic。记pic的负样本pic pic。对于[pic],设[Gi]与[pic]属于相同故障类型为正事件,否则为负事件。在对比学习训练过程中,若[N]充分大,则负事件将成为小概率事件。在此情况下,[pic]与[pic]可以视为同一故障类型的不同视角,即为表示学习训练过程中提炼的任务相关信息。因此,训练中[N]应当尽可能地大,以保证学习效果。

2.3 转辙机监测数据对比表示学习

本文对比表示学习模型命名为AE-CLR (Autoencoder based contrastive learning of representations),其总体结构如图4所示。该模型通过嵌入网络pic从经预处理的转辙机数据pic中提取时序动态特征,并嵌入到表示空间中,得到关于picpic为表示特征picpic的网络结构与pic相同,但各自维护独立的网络参数。pic可以表示为:

pic (10)

其中,pic是嵌入网络的参数集合。

图4
基于自监督表示学习的转辙机故障诊断方法总体框图
pic

在对比表示学习过程中,通过pic可以从pic中提取样本的表示特征,得到对应的表示集合pic。对于样本pic,根据式(9)构建正样本pic与负样本pic,可以得到对应的表示子集picpic,则训练目标是使pic内表示在空间中聚集,同时使pic内表示在空间中分散。为实现这一目标,采用NT-Xent (Normalized temperature-scaled cross entropy)损失[15]训练模型,定义对比损失pic如下:

pic (11)

式(11)中:picpic分别表示picpic内的元素,pic代表2个向量之间的余弦相似度,pic是用于控制表征分布的温度系数超参数。当pic取值适当时,所学习的表示特征分布能够有效保留原始数据的潜在分类结构,从而有助于提升下游故障诊断任务的性能。

2.4 转辙机故障诊断方法

AE-CLR模型通过对比表示学习提取数据的表示特征,并在此基础上通过下游任务实现故障诊断功能。该下游任务通过一个由全连接层和SoftMax输出层构成的分类器网络pic实现,如图4所示。为实现故障诊断任务,通过3个步骤训练pic:1) 利用pic提取训练集数据的表示特征集合;2) 对表示集合进行聚类并整理类簇标签;3) 利用表示特征作为输入,使用类簇标签监督训练pic网络,并采用交叉熵损失函数量化分类误差:

pic (12)

式中:pic表示类簇的标签;pic代表类簇的总数;pic是类簇标签分布的one-hot编码向量;pic表示pic输出的概率分布向量。

3 实验分析

3.1 实验数据集

为验证本文模型在无标签场景下的故障诊断能力,本研究采集了广州铁路局现场多个ZDJ9与ZYJ7型转辙机设备的真实故障数据进行实验分析,相关数据见表2

表2
ZDJ9型与ZYJ7型转辙机动作功率数据集
型号编号数据类别训练样本量测试样本量
ZDJ90正常数据731100
ZDJ91转换卡阻128100
ZDJ92解锁峰值过高108100
ZDJ93解锁超时171100
ZDJ94转换异常89100
ZDJ95动作区功率值过大及锁闭卡阻72100
ZDJ96转换区功率过高122100
ZDJ97锁闭区卡阻105100
ZYJ70正常数据300
ZYJ71转换卡阻300
ZYJ77锁闭区卡阻300
ZYJ78动作时间短130
展开更多
3.2 实验方法及评价指标

本文AE-CLR模型将故障诊断任务视为分类问题,重点在于利用对比学习机制在表示学习阶段聚合同一故障类型的不同表示,并在此基础上通过分类器网络将表示转换为分类标签编码。实验采用现场真实ZDJ9型转辙机训练数据集训练模型,并使用同型号测试数据集验证故障诊断效果,具体实验过程如下。

步骤1 数据集划分:按照表2所示比例将数据集随机划分为训练集pic与测试集pic,并将各样本标记为picpic

步骤2 数据预处理:根据式(1)~式(3),分别得到picpic中时间序列数据的干涉图像;

步骤3 训练CNN自编码器模型:根据图3所示网络结构,设置并训练编码器pic和解码器pic

步骤4 训练对比表示学习模型:根据图4所示框架,建立与pic同结构的嵌入网络pic,结合picpic的自编码,依据对比损失pic调整网络参数,从而得到最优模型;

步骤5 故障模式挖掘:利用DBSCAN算法对通过pic得到的pic对应的表示特征pic聚类,建立pic类簇标签与真实故障类型的关联,得到后验标签pic

步骤6 训练下游分类模型:根据pic与其pic设置模型输入输出节点并训练pic网络;

步骤7 验证模型性能:将pic输入训练好的pic网络得到pic,随后将pic输入pic得到pic,通过picpic计算故障诊断结果的准确率、召回率和F1值作为评价指标,具体定义为:

pic (13)pic (14)pic (15)
3.3 实验环境及超参数分析

本文实验在PyTorch 2.01框架下进行,其主要硬件配置包括Nvidia GeForce RTX2060显卡和Intel(R) Core i7-9750H @ 2.6GHz 处理器。

本文AE-CLR模型在表示学习阶段采用对比学习范式增强表示特征性能,此过程主要关注3个关键超参数:训练批次样本量pic,表示特征维度pic以及温度系数pic(参见式(11))。根据文献[19-20]的分析,较大的pic有助于提升对比学习效果。因此,考虑到实验环境的计算资源限制,设定批次样本量pic。为分析温度系数pic对模型诊断性能的影响,本文进一步分析了常见温度系数条件下,即pic时模型故障诊断结果的F1值。

为了评估模型超参数对训练效果的影响,通过ZDJ9训练集对AE-CLR模型进行训练,并在ZDJ9测试集上评估了其故障诊断性能。图5呈现了20次实验的故障诊断F1分数平均值及其标准偏差。其中,温度系数pic超参数能够控制所学习表示特征在潜空间中的分布情况,当pic取值适当时,所学习的表示特征分布能够有效保留原始数据的潜在分类结构,从而有助于提升下游故障诊断任务的性能。实验结果表明,温度系数pic时,模型展现出最佳的诊断性能,此时F1分数的平均值为0.999,标准偏差为0.001。在该参数配置下,AE-CLR模型的诊断准确性和训练过程的稳定性均较好,因此设定温度系数pic。此外,表示特征pic的维度pic关系到其对不同类别数据的区分能力,实验表明,当pic时,AE-CLR模型的故障诊断F1均值达到0.999。然后,随着pic增加,故障诊断性能无明显提升,综合权衡计算资源与模型效能,设定特征表示维度pic

图5
超参数对模型诊断性能的影响
pic

图6给出了基于所选超参数的模型训练损失曲线。训练集和验证集的损失值均展现出良好的收敛性,经过80次迭代后趋向稳定,没有明显的过拟合或欠拟合现象,表明AE-CLR模型的训练过程有效。

图6
AE-CLR模型的对比损失曲线
pic
3.4 消融实验分析

为了验证本文AE-CLR模型对比学习机制及相应的正负样本策略的贡献,对比了4种模型学习到的表示特征在数据区分方面的性能。作为基准,选取了未集成对比学习机制的无监督与监督自动编码器。此外,引入基于对比学习的SimCLR模型[15],它通过向数据注入信噪比为0.8的椒盐噪声来生成正样本,通过对比SimCLR来分析本文代理任务的效果。图7展示了采用t-SNE算法降维后的表示特征,以分析4种模型表示在潜在空间中的分布情况。结果显示,监督自编码器借助标签指导训练,其表示对不同类型的数据呈现明显区分。与之相比,无监督自编码器在第3类和第4类数据的表示上出现重叠,缺乏明显界限。尽管SimCLR模型采用了对比学习策略,但其表示仍然显示出重叠现象,这表明该模型的数据增强策略对转辙机数据的表示学习效果有限。相较之下,AE-CLR模型的表示呈现不同类别数据的簇状分布。特别是,正常数据(类型0)的表示在潜在空间中分成了两簇,这一现象主要源于道岔正向与反向转换在动作曲线上的差异性。

图7
不同模型所学习表示在潜在空间中的分布
pic

为进一步定量评估图7中表示特征在数据区分能力方面的性能,本文采用DBSCAN算法对4种模型学习到的表示进行聚类,相应结果见表3。在表3中,同质性用于衡量簇内元素是否仅来自单一类别;完整性则评估了给定类别的所有成员是否被归于同一簇;Fowlkes-Mallows指数(FMI)是准确率和召回率的几何平均,用于评价聚类结果与真实故障类型的一致性。结果显示,监督自编码器在所有指标都接近1,这表明其学习到的表示特征与相应故障类型高度匹配,形成一一对应的簇。相比之下,无监督自动编码器和SimCLR在同质性与FMI上表现不佳,反映了其表示分布存在重叠,影响了表示区分数据的能力。AE-CLR在同质性和FMI方面仅次于最优表现,表明其表示的分布上不存在重叠。然而,由于该模型进一步区分出正常数据的道岔正向和反向转换,形成2个簇,导致完整性指标有所下降。该实验证实了AE-CLR模型能够通过对比学习机制及其相应的代理任务有效地学习转辙机各故障类型的表示特征。

表3
不同模型学习表示的聚类结果分析
表示学习方法同质性[21]完整性[21]FMI[22]
无监督自动编码器0.913 30.955 00.859 1
监督自动编码器0.996 60.996 60.997 5
SimCLR[15]0.913 90.932 00.847 6
AE-CLR0.990 50.931 00.951 8
展开更多
3.5 故障诊断性能对比分析

为了进一步分析本文AE-CLR模型的故障诊断性能,选择了4种最近发表的转辙机故障诊断方法进行对比。为了有效评估模型的诊断性能,实验统一采用Adam优化器调整对比模型参数,学习率设置为10-3,训练批次样本量N=400,DAE与AE-CLR模型中自编码、表示编码维度为16,AE-CLR中温度系数为0.2。对比实验结果如表4所示。

表4
基于ZDJ9数据训练模型的故障诊断效果对比
方法

监督

模式

准确率/%召回率/%F1值
CNN-LeNet5[4]监督85.5285.940.857 3
ACGAN[9]监督99.8899.880.998 7
CNN-GRU[8]监督95.4295.390.954 0
DAE[3]无监督92.5892.630.926 4
本文AE-CLR自监督99.6399.630.996 2
展开更多

由于现场收集的转辙机真实故障数据有限,用于测试的ZDJ9型设备各类故障数据仅有100条。如表4所示,在此小规模的测试集下,AE-CLR的诊断准确率达到了99.63%,不排除其在更大规模测试集上准确度有所下降的可能性。在不依赖数据标签的情况下,AE-CLR在准确率、召回率以及F1值方面的表现略次于基于ACGAN的监督学习方法,并超越了CNN-LeNet5和CNN-GRU监督学习方法。此外,与无监督学习DAE方法相比,AE-CLR表现出明显的诊断性能提升。

表5
融合ZDJ9和ZYJ7数据训练模型后的诊断效果对比
方法

监督

模式

准确率/%召回率/%F1值
CNN-LeNet5[4]监督80.1479.960.800 5
ACGAN[9]监督99.6399.630.996 2
CNN-GRU[8]监督95.4295.390.954 0
DAE[3]无监督88.2488.460.883 2
AE-CLR自监督99.8899.880.998 7
展开更多

为进一步评估融合数据集对表示学习过程的泛化能力及其对DAE和本文AE-CLR故障诊断性能的影响,在实验步骤1中将ZDJ9和ZYJ7型训练集数据混合作为融合训练集,以扩充表示学习的训练样本分布;随后在步骤4中仅使用ZDJ9型数据的表示特征以挖掘其数据类型,其他步骤保持不变。具体的实验数据构成参见表2,鉴于ZDJ9和ZYJ7型转辙机数据之间的差异性,融合训练集未能增强监督学习模型的诊断效果,CNN-LeNet5等其他3个监督模型的诊断性能存在不同程度的下降。同时,无监督DAE方法的诊断性能也下降了4.34%。相比之下,本文AE-CLR模型在融合训练集下的故障诊断性能获得提升,并且在相同条件下超越所有监督学习方法。这一结果体现了AE-CLR模型在泛化学习方面的优势,通过融合不同类型的转辙机数据进行训练,可以在一定程度上增强训练效果,从而缓解现场转辙机故障样本稀缺的问题。

4 结论

1) 针对铁路转辙机型号多样性、故障样本稀缺性以及数据标注缺失等挑战,提出一种基于自监督表示学习的转辙机故障诊断方法。该方法无需大量有标签的数据进行训练,即可实现与监督学习模型相当的故障诊断性能。

2) 与传统的监督学习模型相比,本文方法依据数据间的固有相似性关系来指导训练过程,其表示学习性能不受人为定义标签变动的影响。因此,该表示学习方法能够支持多样化的下游任务,具有较高的工程实用性潜力。

3) 实验结果表明,采用单一型号转辙机数据进行模型训练后,故障诊断的准确率可达99.63%。当融合多型号转辙机数据进行训练时,模型的准确率进一步提升至99.88%,具有优秀的故障诊断性能。

参考文献
1CAO Yuan, SUN Yongkui, XIE Guo, et al.

A sound-based fault diagnosis method for railway point machines based on two-stage feature selection strategy and ensemble classifier

[J]. IEEE Transactions on Intelligent Transportation Systems, 2022, 23(8): 12074-12083.
百度学术谷歌学术
2WANG Zhipeng, WANG Ning, ZHANG Huiyue, et al.

Segmentalized mRMR features and cost-sensitive ELM with fixed inputs for fault diagnosis of high-speed railway turnouts

[J]. IEEE Transactions on Intelligent Transportation Systems, 2023, 24(5): 4975-4987.
百度学术谷歌学术
3GUO Zijian, WAN Yiming, YE Hao.

An unsupervised fault-detection method for railway turnouts

[J]. IEEE Transactions on Instrumentation and Measurement, 2020, 69(11): 8881-8901.
百度学术谷歌学术
4WEN Long, LI Xinyu, GAO Liang, et al.

A new convolutional neural network-based data-driven fault diagnosis method

[J]. IEEE Transactions on Industrial Electronics, 2018, 65(7): 5990-5998.
百度学术谷歌学术
5赵盼, 王小敏, 傅美君.

基于贝叶斯元学习的小样本转辙机故障诊断

[J]. 铁道科学与工程学报, 2023, 20(10): 4008-4020.
百度学术谷歌学术
6ZHANG Yao, XU Tianhua, CHEN Cong, et al.

A hierarchical method based on improved deep forest and case-based reasoning for railway turnout fault diagnosis

[J]. Engineering Failure Analysis, 2021, 127: 105446.
百度学术谷歌学术
7郑云水, 白邓宇, 王妍.

基于相似度的道岔健康状态评估及故障检测方法研究

[J]. 铁道科学与工程学报, 2021, 18(4): 877-884.
百度学术谷歌学术
8杨菊花, 于苡健, 陈光武, .

基于CNN-GRU模型的道岔故障诊断算法研究

[J]. 铁道学报, 2020, 42(7): 102-109.
百度学术谷歌学术
9郑启明, 姚新文, 陈光武, .

基于改进对抗网络与自适应数据对齐的转辙机故障诊断研究

[J]. 铁道学报, 2023, 45(10): 96-104.
百度学术谷歌学术
10李新琴, 史天运, 李平, .

基于文本的高速铁路信号设备故障知识抽取方法研究

[J]. 铁道学报, 2021, 43(3): 92-100.
百度学术谷歌学术
11SOARES N, DE AGUIAR E P, SOUZA A C, et al.

Unsupervised machine learning techniques to prevent faults in railroad switch machines

[J]. International Journal of Critical Infrastructure Protection, 2021, 33: 100423.
百度学术谷歌学术
12孔令刚, 焦相萌, 陈光武, .

基于Mallat小波分解与改进GWO-SVM的道岔故障诊断

[J]. 铁道科学与工程学报, 2020, 17(5): 1070-1079.
百度学术谷歌学术
13ERHAN D, COURVILLE A, BENGIO Y, et al.

Why does unsupervised pre-training help deep learning?

[C]// Proceedings of the Thirteenth International Conference on Artificial Intelligence and Statistics. JMLR Workshop and Conference Proceedings. March 31, 2010.
百度学术谷歌学术
14LECUN Y, BENGIO Y, HINTON G.

Deep learning

[J]. Nature, 2015, 521: 436-444.
百度学术谷歌学术
15CHEN Ting, KORNBLITH S, NOROUZI M, et al.

A simple framework for contrastive learning of visual representations

[C]// Proceedings of the 37th International Conference on Machine Learning. ACM, 2020: 1597-1607.
百度学术谷歌学术
16WICKSTRØM K, KAMPFFMEYER M, MIKALSEN K Ø, et al.

Mixing up contrastive learning: self-supervised representation learning for time series

[J]. Pattern Recognition Letters, 2022, 155(C): 54-61.
百度学术谷歌学术
17GAO Wei, JIN Hui, YANG Gengjie.

Series arc fault diagnosis method of photovoltaic arrays based on GASF and improved DCGAN

[J]. Advanced Engineering Informatics, 2022, 54: 101809.
百度学术谷歌学术
18LIU Yang, WANG Keze, LI Guanbin, et al.

Semantics-aware adaptive knowledge distillation for sensor-to-vision action recognition

[J]. IEEE Transactions on Image Processing: a Publication of the IEEE Signal Processing Society, 2021, 30: 5573-5588.
百度学术谷歌学术
19CHEN Ting, KORNBLITH S, SWERSKY K, et al.

Big self-supervised models are strong semi-supervised learners

[EB/OL]. 2020: arXiv: 2006.10029. http://arxiv.org/abs/2006.10029.
百度学术谷歌学术
20GRILL J B, STRUB F, ALTCHÉ F, et al.

Bootstrap your own latent a new approach to self-supervised learning

[C]// Proceedings of the 34th International Conference on Neural Information Processing Systems. December 6-12, 2020, Vancouver, BC, Canada. ACM, 2020: 21271-21284.
百度学术谷歌学术
21ROSENBERG A, HIRSCHBERG J.

V-Measure: a conditional entropy-based external cluster evaluation measure

[C]// EMNLP-CoNLL 2007-Proceedings of the 2007 Joint Conference on Empirical Methods in Natural Language Processing and Computational Natural Language Learning, 2007: 410-420.
百度学术谷歌学术
22FOWLKES E B, MALLOWS C L.

A method for comparing two hierarchical clusterings

[J]. Journal of the American Statistical Association, 1983, 78(383): 553-569.
百度学术谷歌学术
注释

郑启明,王小敏,江磊.基于无标签自监督表示学习的转辙机故障诊断方法研究[J].铁道科学与工程学报,2025,22(01):404-415.

ZHENG Qiming,WANG Xiaomin,JIANG Lei.An unlabeled self-supervised fault diagnosis method for switch machines based on contrastive learning of representations[J].Journal of Railway Science and Engineering,2025,22(01):404-415.