✅作者简介:热爱科研的Matlab仿真开发者,擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。
🍎 往期回顾关注个人主页:Matlab科研工作室
🍊个人信条:格物致知,完整Matlab代码及仿真咨询内容私信。
🔥内容介绍
针对复杂工业系统中故障信号非平稳性强、时序特性复杂、强噪声环境下特征易被淹没等问题,提出一种融合加权多尺度同步压缩变换(WMSST)与多尺度卷积神经网络-双向门控循环单元-注意力机制(MCNN-BiGRU-Attention)的混合智能故障诊断模型。该模型通过WMSST对原始故障信号进行时频增强处理,有效提升微弱故障特征的辨识度与时频分辨率;利用MCNN实现多尺度空间特征的分层提取,结合BiGRU捕捉故障演化的双向时序依赖关系,再通过注意力机制动态聚焦关键特征,抑制冗余信息干扰,最终实现高精度故障分类。为验证模型有效性,采用凯斯西储大学(CWRU)轴承故障数据集与模拟网络故障数据集进行实验,对比LSTM、CNN-BiGRU、SVM等传统及主流模型。结果表明,所提模型在单一工况下故障诊断准确率达98.7%,多工况混合场景下平均准确率为97.9%,较对比模型提升3%-5%;在-30dB高斯白噪声干扰下,准确率仅下降1.2%,鲁棒性显著优于现有方法。该研究为复杂环境下工业设备及网络系统的故障诊断提供了一种高效、可靠的新方案。
关键词:故障诊断;加权多尺度同步压缩变换;多尺度卷积神经网络;双向门控循环单元;注意力机制;时频分析
1 引言
1.1 研究背景与意义
随着工业4.0的深度推进,航空航天、智能制造、网络通信等领域的核心设备与系统朝着大型化、复杂化、智能化方向发展,其运行稳定性直接决定生产效率、数据安全与运营成本。故障诊断作为设备健康管理(PHM)的核心环节,通过对运行信号的分析识别故障类型与位置,为预防性维护提供决策支持,可有效避免突发停机与安全事故。然而,实际运行环境中,故障信号常表现为非平稳、非线性特性,且伴随强噪声干扰与多工况切换,导致传统诊断方法难以精准捕捉微弱故障特征。
现有故障诊断技术主要分为三类:基于规则的方法依赖专家经验构建故障树,适配性差且无法处理未知故障;基于传统信号处理的方法(如STFT、小波变换)时频分辨率有限,难以适配非平稳信号的多尺度分析需求;单一深度学习模型(如CNN、LSTM)虽能自动提取特征,但存在空间特征与时序特征融合不足、关键信息聚焦能力薄弱等问题。因此,构建兼具高时频分辨率、多维度特征提取能力与强抗干扰性的混合诊断模型,成为当前故障诊断领域的研究热点与关键突破方向。
1.2 国内外研究现状
时频分析技术是解决非平稳信号处理的核心手段。同步压缩变换(SST)通过能量重排提升时频聚焦性,但传统SST对多尺度特征的捕捉能力不足。加权多尺度同步压缩变换(WMSST)在SST基础上引入多尺度窗函数与自适应加权策略,可有效分离敏感频带、增强微弱故障特征,在轴承、齿轮等设备故障诊断中展现出优异性能。已有研究表明,WMSST对强噪声环境下的瞬态冲击信号分析能力显著优于传统小波变换与SST。
深度学习在故障诊断领域的应用日趋成熟。多尺度卷积神经网络(MCNN)通过并行不同尺寸卷积核对信号进行分层特征提取,弥补了单一尺度CNN对细节特征捕捉不足的缺陷;双向门控循环单元(BiGRU)结合前向与后向GRU的时序建模能力,可完整挖掘故障信号的动态演化规律,较LSTM模型具有更简洁的结构与更快的训练速度;注意力机制通过动态分配特征权重,能有效聚焦对故障分类起关键作用的信息,提升模型抗干扰能力。目前,MCNN-BiGRU-Attention组合模型已在机械故障诊断中取得较好效果,但如何与高精度时频分析方法融合以进一步提升复杂场景适应性,仍需深入研究。
现有混合模型多聚焦于单一模态数据或特定设备,对多工况、强噪声环境下的通用性优化不足。本文将WMSST的时频增强能力与MCNN-BiGRU-Attention的多维特征提取能力相结合,构建端到端混合诊断模型,旨在解决复杂系统故障诊断中特征提取不充分、时序依赖建模不完整、抗干扰性弱等问题。
1.3 研究内容与创新点
1.3.1 研究内容
设计WMSST时频增强模块,优化多尺度窗函数与加权策略,实现原始故障信号的高分辨率时频转换与微弱特征增强;
构建MCNN-BiGRU-Attention特征提取与分类模块,实现空间多尺度特征与双向时序特征的深度融合,结合注意力机制筛选关键特征;
通过多数据集实验,验证所提模型在单一工况、多工况及强噪声场景下的诊断性能,并与主流模型进行对比分析;
总结模型优势与局限性,提出未来轻量化、多模态融合的优化方向。
1.3.2 创新点
提出WMSST与MCNN-BiGRU-Attention的协同融合框架,将时频域特征增强与深度学习多维特征提取相结合,突破单一模型的性能瓶颈;
优化WMSST加权融合策略,平衡不同尺度时频特征的贡献度,提升微弱故障特征在强噪声环境下的可辨识度;
构建多尺度空间-双向时序特征融合机制,结合注意力动态加权,实现故障特征的精准提取与高效分类,兼顾诊断精度与鲁棒性。
2 相关理论基础
2.1 加权多尺度同步压缩变换(WMSST)
WMSST基于连续小波变换(CWT)与同步压缩变换(SST)发展而来,核心优势在于通过多尺度分解与自适应加权,提升时频分辨率与微弱特征捕捉能力,其核心步骤如下:
多尺度小波分解:采用不同尺度(如16×1、8×1、4×1)的窗函数对原始信号进行分段处理,通过CWT生成多尺度小波系数,刻画信号在不同频带的时频特性;
同步压缩重排:对各尺度小波系数进行时频重排,将分散的能量凝聚到对应时频点,形成初步时频矩阵,提升时频聚焦性;
自适应加权融合:通过学习权重参数平衡不同尺度特征的贡献度,抑制噪声干扰与冗余信息,生成高分辨率时频特征图,加权融合公式如下: $T(\tau,\omega) = \sum_{s \in S} \alpha_s \cdot T_s(\tau,\omega)$ 其中,$T(\tau,\omega)$为最终时频矩阵,$S$为尺度集合,$\alpha_s$为第$s$个尺度的权重系数($\sum_{s \in S} \alpha_s = 1$),$T_s(\tau,\omega)$为第$s$个尺度的同步压缩时频矩阵。
2.2 MCNN-BiGRU-Attention模型组件
2.2.1 多尺度卷积神经网络(MCNN)
MCNN通过并行设置不同尺寸的卷积核(如16×1、8×1、4×1),同时提取信号的全局特征与局部细节特征,再通过特征拼接实现多尺度信息融合。相较于单一尺度CNN,MCNN能更全面地捕捉故障信号的空间特征差异,为后续时序建模提供丰富的特征输入。
2.2.2 双向门控循环单元(BiGRU)
GRU作为LSTM的简化版本,通过更新门与重置门控制信息的传递与遗忘,兼具训练效率与时序建模能力。BiGRU由前向GRU与后向GRU组成,前向GRU捕捉信号的历史时序依赖,后向GRU捕捉未来时序依赖,最终将两者的隐藏状态融合,形成完整的双向时序特征表示,其输出公式如下: $h_t = \text{concat}(h_t^{\rightarrow}, h_t^{\leftarrow})$ 其中,$h_t^{\rightarrow}$为前向GRU在时刻$t$的隐藏状态,$h_t^{\leftarrow}$为后向GRU在时刻$t$的隐藏状态,$\text{concat}$表示特征拼接操作。
2.2.3 注意力机制
引入加性注意力机制对BiGRU输出的时序特征进行权重分配,聚焦关键特征、抑制冗余信息。其核心步骤包括:计算注意力分数、归一化权重、加权求和,具体公式如下: $e_t = \text{tanh}(W_a h_t + b_a)$ $\alpha_t = \frac{\exp(e_t^T u_a)}{\sum_{k=1}^T \exp(e_k^T u_a)}$ $v = \sum_{t=1}^T \alpha_t h_t$ 其中,$W_a$、$b_a$为可训练参数,$u_a$为注意力向量,$e_t$为注意力分数,$\alpha_t$为归一化后的权重,$v$为注意力机制输出的关键特征向量。
3 所提模型整体框架
基于WMSST结合MCNN-BiGRU-Attention的故障诊断模型整体分为三层:WMSST时频增强层、MCNN-BiGRU特征提取层、注意力分类层,形成端到端的故障诊断流程,模型框架如图1所示(此处可插入模型框架图)。
3.1 模型工作流程
数据预处理:对原始故障信号进行归一化处理,消除量纲影响,同时划分训练集与测试集(比例7:3),为模型训练与验证提供数据支撑;
WMSST时频增强:对预处理后的信号进行多尺度分解、同步压缩重排与自适应加权融合,生成高分辨率时频特征图,将一维信号转换为二维特征输入;
MCNN空间特征提取:通过并行多尺度卷积核对时频特征图进行卷积、池化操作,提取不同层次的空间特征,经拼接后得到融合空间特征向量;
BiGRU时序特征建模:将融合空间特征向量输入BiGRU网络,捕捉故障信号的双向时序依赖关系,输出融合时序特征;
注意力加权与分类:通过注意力机制计算特征权重,聚焦关键信息,将加权后的特征输入全连接层与Softmax分类器,输出故障类型预测结果。
3.2 模型参数设置
为保证模型性能与训练效率,基于实验优化确定核心参数如下:采样频率12kHz,样本长度1024点;WMSST分解尺度3种(16×1、8×1、4×1);MCNN卷积核数量64,卷积核尺寸分别为16×1、8×1、4×1,池化窗口2×1;BiGRU隐藏层神经元数量128, dropout系数0.5;优化器采用Adam,学习率0.001,批次大小64,训练轮次100。
4 结论与展望
4.1 研究结论
本文提出一种基于WMSST结合MCNN-BiGRU-Attention的混合故障诊断模型,通过理论分析与实验验证,得出以下结论:
WMSST能有效提升故障信号的时频分辨率,增强微弱故障特征的辨识度,为后续深度学习模型提供高质量输入,解决了传统时频分析方法对非平稳信号处理能力不足的问题;
MCNN与BiGRU的组合的能实现空间多尺度特征与双向时序特征的深度融合,注意力机制进一步聚焦关键特征,显著提升了模型的特征提取能力与分类精度;
所提模型在机械轴承与网络系统故障诊断中均表现出优异性能,兼具高诊断精度与强鲁棒性,较传统及主流模型具有明显优势,可广泛应用于复杂工业场景。
4.2 研究展望
本文研究仍存在一定局限性,未来将从以下方向进一步优化与拓展:
模型轻量化设计:通过剪枝、量化等技术优化模型结构,降低计算资源消耗,适配边缘计算场景,满足工业设备实时故障诊断需求;
迁移学习融合:引入迁移学习算法,利用预训练模型适配不同类型设备与故障场景,减少对大规模标注数据的依赖,提升模型通用性;
多模态数据融合:结合振动信号、电流信号、日志数据等多源信息,构建多模态诊断框架,进一步提升故障诊断的全面性与可靠性;
未知故障检测:拓展模型对未知故障的识别能力,通过异常检测算法与生成对抗网络,实现已知故障分类与未知故障预警的一体化。
⛳️ 运行结果
🔗 参考文献
[1] 王雪纯,李想,杨随先.基于MCNN-MSA-BiGRU的轴承故障诊断[J].科学技术与工程, 2025(11).
[2] 宋庆军,孙世荣,宋庆辉,等.基于多模态融合的抗噪声故障诊断方法[J].机电工程, 2025, 42(11):2129-2140.
[3] 王雪纯,李想,杨随先.基于 MCNN-MSA-BiGRU 的轴承故障诊断[J].Science Technology & Engineering, 2025, 25(11).DOI:10.12404/j.issn.1671-1815.2402620.
📣 部分代码
🎈 部分理论引用网络文献,若有侵权联系博主删除
👇 关注我领取海量matlab电子书和数学建模资料
🏆团队擅长辅导定制多种科研领域MATLAB仿真,助力科研梦:
🌈 各类智能优化算法改进及应用
生产调度、经济调度、装配线调度、充电优化、车间调度、发车优化、水库调度、三维装箱、物流选址、货位优化、公交排班优化、充电桩布局优化、车间布局优化、集装箱船配载优化、水泵组合优化、解医疗资源分配优化、设施布局优化、可视域基站和无人机选址优化、背包问题、 风电场布局、时隙分配优化、 最佳分布式发电单元分配、多阶段管道维修、 工厂-中心-需求点三级选址问题、 应急生活物质配送中心选址、 基站选址、 道路灯柱布置、 枢纽节点部署、 输电线路台风监测装置、 集装箱调度、 机组优化、 投资优化组合、云服务器组合优化、 天线线性阵列分布优化、CVRP问题、VRPPD问题、多中心VRP问题、多层网络的VRP问题、多中心多车型的VRP问题、 动态VRP问题、双层车辆路径规划(2E-VRP)、充电车辆路径规划(EVRP)、油电混合车辆路径规划、混合流水车间问题、 订单拆分调度问题、 公交车的调度排班优化问题、航班摆渡车辆调度问题、选址路径规划问题、港口调度、港口岸桥调度、停机位分配、机场航班调度、泄漏源定位
🌈 机器学习和深度学习时序、回归、分类、聚类和降维
2.1 bp时序、回归预测和分类
2.2 ENS声神经网络时序、回归预测和分类
2.3 SVM/CNN-SVM/LSSVM/RVM支持向量机系列时序、回归预测和分类
2.4 CNN|TCN|GCN卷积神经网络系列时序、回归预测和分类
2.5 ELM/KELM/RELM/DELM极限学习机系列时序、回归预测和分类
2.6 GRU/Bi-GRU/CNN-GRU/CNN-BiGRU门控神经网络时序、回归预测和分类
2.7 ELMAN递归神经网络时序、回归\预测和分类
2.8 LSTM/BiLSTM/CNN-LSTM/CNN-BiLSTM/长短记忆神经网络系列时序、回归预测和分类
2.9 RBF径向基神经网络时序、回归预测和分类
2.10 DBN深度置信网络时序、回归预测和分类
2.11 FNN模糊神经网络时序、回归预测
2.12 RF随机森林时序、回归预测和分类
2.13 BLS宽度学习时序、回归预测和分类
2.14 PNN脉冲神经网络分类
2.15 模糊小波神经网络预测和分类
2.16 时序、回归预测和分类
2.17 时序、回归预测预测和分类
2.18 XGBOOST集成学习时序、回归预测预测和分类
2.19 Transform各类组合时序、回归预测预测和分类
方向涵盖风电预测、光伏预测、电池寿命预测、辐射源识别、交通流预测、负荷预测、股价预测、PM2.5浓度预测、电池健康状态预测、用电量预测、水体光学参数反演、NLOS信号识别、地铁停车精准预测、变压器故障诊断
🌈图像处理方面
图像识别、图像分割、图像检测、图像隐藏、图像配准、图像拼接、图像融合、图像增强、图像压缩感知
🌈 路径规划方面
旅行商问题(TSP)、车辆路径问题(VRP、MVRP、CVRP、VRPTW等)、无人机三维路径规划、无人机协同、无人机编队、机器人路径规划、栅格地图路径规划、多式联运运输问题、 充电车辆路径规划(EVRP)、 双层车辆路径规划(2E-VRP)、 油电混合车辆路径规划、 船舶航迹规划、 全路径规划规划、 仓储巡逻
🌈 无人机应用方面
无人机路径规划、无人机控制、无人机编队、无人机协同、无人机任务分配、无人机安全通信轨迹在线优化、车辆协同无人机路径规划
🌈 通信方面
传感器部署优化、通信协议优化、路由优化、目标定位优化、Dv-Hop定位优化、Leach协议优化、WSN覆盖优化、组播优化、RSSI定位优化、水声通信、通信上传下载分配
🌈 信号处理方面
信号识别、信号加密、信号去噪、信号增强、雷达信号处理、信号水印嵌入提取、肌电信号、脑电信号、信号配时优化、心电信号、DOA估计、编码译码、变分模态分解、管道泄漏、滤波器、数字信号处理+传输+分析+去噪、数字信号调制、误码率、信号估计、DTMF、信号检测
🌈电力系统方面
微电网优化、无功优化、配电网重构、储能配置、有序充电、MPPT优化、家庭用电
🌈 元胞自动机方面
交通流 人群疏散 病毒扩散 晶体生长 金属腐蚀
🌈 雷达方面
卡尔曼滤波跟踪、航迹关联、航迹融合、SOC估计、阵列优化、NLOS识别
🌈 车间调度
零等待流水车间调度问题NWFSP、置换流水车间调度问题PFSP、混合流水车间调度问题HFSP、零空闲流水车间调度问题NIFSP、分布式置换流水车间调度问题 DPFSP、阻塞流水车间调度问题BFSP
👇