Estimation of Bearing Remaining Useful Life Based on Multiscale Convolutional Neural Network
Estimation of Bearing Remaining Useful Life Based on Multiscale Convolutional Neural Network
问题:
轴承剩余使用寿命估计RUL
解决问题面对的挑战
如何有效地从数据中提取特征 并准确预测RUL
已有工作的优缺点
RUL方法
- 基于模型的方法需要充分理解系统的失效机理 并建立描述退化趋势的物理模型 。在系统复杂的情况下,这种信息很难获得。
- 数据驱动方法通常需要: 1. 通过信号处理或统计投影手动提出或提取HIs。2: 在模型选择和参数调整方面的很麻烦。3. 用于RUL估计的自动特征表示和学习方法要求很高。
本工作的和已有工作的区别
区别:
与传统的仅利用最后一个卷积层特征的CNN结构不同,**MSCNN结构将之前的最后一个卷积层与池层集成,形成一个多尺度(混合)层,以便为预测保留多个抽象级别。**该模型中有效的特征挖掘能成功预测RUL。
本工作的贡献可以总结如下:
1) 采用MSCNN模型结构来提取更多可识别特征 ,用于RUL预测。通过多尺度层,保持全局和局部特征,以增强网络容量。
2) 该系统方法将TFR和MSCNN集成到一个框架中,可以实现RUL的自动估计 。
3) 本研究首先利用MSCNN进行轴承RUL预测。
本工作的方法
一种新的基于TFR和MSCNN的深度特征学习RUL预测方法。试图基于MSCNN直接找到退化的TFR和RUL之间的关系
步骤:
- 在采集到退化信号后,利用小波变换得到各退化信号的TFR,采用双线性插值为减小其维数。
- 将调整后的TFRS与指定的RULs一起发送到MSCNN,建立预测模型。

名词
RUL remaining useful life 寿命预测
TFR time frequency representation 时频表示
MSCNN Multiscale convolutional neural network 多尺度卷积神经网络
WT Wavelet transform 小波变换
HI Health indicator 健康指标
SOM Self-organizing map 自组织映射
RNN Recurrent neural network 循环神经网络
** 问题:**轴承剩余使用寿命估计
**挑战:如何有效地从数据中提取特征并准确预测RUL 仍然被认为是PHM的一个挑战。
现有方法:
RUL估计方法大致可分为基于模型的方法和数据驱动的方法
-
基于模型的方法依赖于在充分了解故障机理后建立数学模型来反映机器的退化趋势。然后,根据收集的数据,可以估计模型参数。
1. 缺点:建立描述退化趋势的物理模型取决于充分理解系统的失效机理。这种信息很难获得,尤其是在系统复杂的情况下。 -
数据驱动方法试图根据测量数据检测降解规律。
1. 统计工具和机器学习是预测RUL的常用数据驱动方法
2. 缺点:通常需要通过信号处理或统计投影手动提出或提取HIs。
3. 数据驱动方法通常将特征提取和模型训练任务分开,因此需要在模型选择和参数调整方面付出巨大努力。开发用于RUL估计的自动特征表示和学习方法要求很高。
本工作的方法
与传统的仅利用最后一个卷积层特征的CNN结构不同,MSCNN结构将之前的最后一个卷积层与池层集成,形成一个多尺度(混合)层,以便为预测保留多个抽象级别。
成功预测RUL的关键在于该模型中有效的特征挖掘。
本文的贡献可以总结如下:
1) 我们采用MSCNN模型结构来提取更多可识别特征,用于RUL预测。通过多尺度层,保持全局和局部特征,以增强网络容量。
2) 该系统方法将TFR和MSCNN集成到一个框架中,可以实现RUL的自动估计。
3) 据我们所知,本研究首先利用MSCNN进行轴承RUL预测。
本工作的方法
一种新的基于TFR和MSCNN的深度特征学习RUL预测方法。试图基于MSCNN直接找到退化的TFR和RUL之间的关系
步骤:
- 在采集到退化信号后,利用小波变换 得到各退化信号的TFR,采用双线性插值为减小其维数 。
- 将调整后的TFRS与指定的RULs一起发送到MSCNN,建立预测模型。
1. 与传统的CNN结构只利用最后一个卷积层的特征不同,MSCNN结构将最后一个卷积层与之前的池化层集成,形成多尺度(混合)层,从而保留了多级抽象用于预测。
当旋转机械开始退化时,测得的振动信号将呈现非平稳特性。在这种情况下,时域和频域分析都无法提供有价值的退化信息。小波变换在旋转机械状态监测中有着广泛的应用。
小波变换:

通过WT将 1-D degradation signal x(t)映射为 2-D coefficients U(α, β) ,这里也称为TFR。
降维
U可以看作是高维特征,它包含了大量的退化信息。使用一种简单的双线性方法,对其进行降维,从而减少计算量。

MSCNN 多尺度卷积神经网络
传统CNN的卷积层输出特征图可以写成

池化层采用Max-pooling池化

因RUL是回归问题,最后一层采用回归层;
MSCNN 网络结构

隐藏层包括三个卷积层、两个池化层和一个混合层。混合层接受特征,这些特征来自展开第三个卷积层和第二个池化层。因此,混合层的输出计算为

参数优化
MSCNN的整个模型参数集Θ可以通过SGD通过BP算法进行优化,使损失函数最小。对于单个样本(x(k), y(k)),我们可以将平方误差定义为

BP的目标是最小化模型参数对L(Θ)的贡献。通过计算L(Θ)对单个权重和偏差的导数,我们可以以迭代的方式进行SGD以最小化整体误差。
可提升的点:
- 虽然比较了不同的基于CNN的特征提取方法,但仍然没有研究如何为MSCNN结构形成最佳的层组合。未来将对此有更多的了解。
- 由于过度拟合是神经网络的常见问题,我们采用ReLU激活和正则化来缓解这个问题。此外,MSCNN结构本身具有跳过连接的特性。为了进一步缓解这一问题,可以引入更多的技术,如dropout技术和稀疏技术。
N的特征提取方法,但仍然没有研究如何为MSCNN结构形成最佳的层组合。未来将对此有更多的了解。
2. 由于过度拟合是神经网络的常见问题,我们采用ReLU激活和正则化来缓解这个问题。此外,MSCNN结构本身具有跳过连接的特性。为了进一步缓解这一问题,可以引入更多的技术,如dropout技术和稀疏技术。
