Federated Learning with Uncertainty-Based Client Clustering for Fleet-Wide Fault Diagnosis

要約

タイトル: フリート全体の故障診断のための不確実性ベースのクライアントクラスタリングによるフェデレーテッドラーニング

要約:
– 産業モニタリングのためのワイヤレスセンシングノードの採用により、多くの業界でオペレーターが監視を推進しており、これらの取り組みによって診断アルゴリズムを構築するために使用できるかなりの状態モニタリングデータセットが生成されました。
– しかし、単一のオペレーターには、データ駆動型アルゴリズムを開発するために十分なデータを収集するための十分に大きなシステムフリートまたはコンポーネントユニットがない場合があります。
– 安全上重要なシステムの十分な故障パターンを収集することは、故障がまれであることにより特に困難です。
– フェデレーテッドラーニング(FL)は、データ機密性を維持しながら分散型アセットの故障診断モデルをトレーニングするための有望なソリューションとして登場しています。
– しかし、クライアントデータセットの多様性の問題や、機密データの漏洩を防ぐことを目的としたフェデレーション戦略の最適化に関しては、まだ克服すべき大きな障壁があります。
– これらの課題に対処するために、データセットの類似性に基づいてフェデレーションされるクライアントをクラスタ化する新しいクラスタリングベースのFLアルゴリズムを提案しています。
– データを明示的に共有せずにクライアント間のデータセットの類似性を定量化するために、各クライアントはローカルテストデータセットを設定し、他のクライアントのモデル予測精度と不確実性をこのテストデータセットで評価します。
– クライアントは、相対的な予測精度と不確実性に基づいてFLのためにクラスタ化されます。

要約(オリジナル)

Operators from various industries have been pushing the adoption of wireless sensing nodes for industrial monitoring, and such efforts have produced sizeable condition monitoring datasets that can be used to build diagnosis algorithms capable of warning maintenance engineers of impending failure or identifying current system health conditions. However, single operators may not have sufficiently large fleets of systems or component units to collect sufficient data to develop data-driven algorithms. Collecting a satisfactory quantity of fault patterns for safety-critical systems is particularly difficult due to the rarity of faults. Federated learning (FL) has emerged as a promising solution to leverage datasets from multiple operators to train a decentralized asset fault diagnosis model while maintaining data confidentiality. However, there are still considerable obstacles to overcome when it comes to optimizing the federation strategy without leaking sensitive data and addressing the issue of client dataset heterogeneity. This is particularly prevalent in fault diagnosis applications due to the high diversity of operating conditions and system configurations. To address these two challenges, we propose a novel clustering-based FL algorithm where clients are clustered for federating based on dataset similarity. To quantify dataset similarity between clients without explicitly sharing data, each client sets aside a local test dataset and evaluates the other clients’ model prediction accuracy and uncertainty on this test dataset. Clients are then clustered for FL based on relative prediction accuracy and uncertainty.

arxiv情報

著者 Hao Lu,Adam Thelen,Olga Fink,Chao Hu,Simon Laflamme
発行日 2023-04-26 04:23:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.DC, cs.LG パーマリンク