Improving Convolutional Neural Networks for Fault Diagnosis by Assimilating Global Features

要約

複雑なプロセスを対象とした最新の故障診断において、ディープラーニングの技術が注目されている。特に、畳み込みニューラルネットワーク(CNN)は、多変量の時系列データを画像に変換して取り扱うことができる魅力的な能力を示している。しかし、既存のCNN技術は、主に入力画像から局所的またはマルチスケールな特徴を捉えることに重点を置いている。深層CNNは、多変量力学データから変換された画像を記述するために重要なグローバルな特徴を間接的に抽出することがしばしば要求される。本論文では、故障診断のために局所的特徴と大域的特徴の両方を直接的に考慮する新しい局所-大域CNN(LG-CNN)アーキテクチャを提案する。具体的には、局所特徴は従来の局所カーネルによって獲得されるのに対し、大域特徴は画像の縦横に渡る1次元のトールカーネルとファットカーネルを用いて抽出される。そして、局所的な特徴と大域的な特徴の両方を、完全連結層を用いて分類するために統合する。提案するLG-CNNはベンチマークであるTennessee Eastman process (TEP)データセットで検証される。従来のCNNとの比較から、提案するLG-CNNはモデルの複雑さを大幅に増加させることなく、故障診断性能を大幅に向上させることができることが示された。これは、LG-CNNがCNNよりもはるかに広い局所受容野を形成することに起因している。提案するLG-CNNは、他の画像処理やコンピュータビジョンのタスクに容易に拡張することが可能である。

要約(オリジナル)

Deep learning techniques have become prominent in modern fault diagnosis for complex processes. In particular, convolutional neural networks (CNNs) have shown an appealing capacity to deal with multivariate time-series data by converting them into images. However, existing CNN techniques mainly focus on capturing local or multi-scale features from input images. A deep CNN is often required to indirectly extract global features, which are critical to describe the images converted from multivariate dynamical data. This paper proposes a novel local-global CNN (LG-CNN) architecture that directly accounts for both local and global features for fault diagnosis. Specifically, the local features are acquired by traditional local kernels whereas global features are extracted by using 1D tall and fat kernels that span the entire height and width of the image. Both local and global features are then merged for classification using fully-connected layers. The proposed LG-CNN is validated on the benchmark Tennessee Eastman process (TEP) dataset. Comparison with traditional CNN shows that the proposed LG-CNN can greatly improve the fault diagnosis performance without significantly increasing the model complexity. This is attributed to the much wider local receptive field created by the LG-CNN than that by CNN. The proposed LG-CNN architecture can be easily extended to other image processing and computer vision tasks.

arxiv情報

著者 Saif S. S. Al-Wahaibi,Qiugang Lu
発行日 2022-10-03 16:49:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.SY, eess.SY パーマリンク