Enhancing Robotic Arm Activity Recognition with Vision Transformers and Wavelet-Transformed Channel State Information

要約

ロボットアームのアクティビティ認識では、視覚ベースの方法が一般的に使用されます。
これらのアプローチは通常、見通し線 (LoS) に依存しており、特にスマート ホーム アプリケーションにおいてプライバシーの懸念が生じます。
パッシブ Wi-Fi センシングは、チャネル状態情報 (CSI) 測定を利用して屋内環境での活動を識別し、人間とロボット アームの活動を認識するための新しいパラダイムを表します。
この論文では、屋内環境での CSI 測定からロボット アームの活動を認識するための、離散ウェーブレット変換とビジョン トランスフォーマーに基づく新しい機械学習アプローチを提案します。
この方法は、ロボット アームのアクティビティ認識において、特に LoS が障壁によって妨げられている場合に、外部または内部のセンサーや視覚補助装置に依存することなく、畳み込みニューラル ネットワーク (CNN) および長短期記憶 (LSTM) モデルよりも優れた性能を発揮します。
実験は 4 つの異なるデータ収集シナリオと 4 つの異なるロボット アームのアクティビティを使用して行われます。
パフォーマンス結果は、ウェーブレット変換がロボット アームのアクティビティ認識におけるビジュアル トランスフォーマー ネットワークの精度を大幅に向上できることを示しています。

要約(オリジナル)

Vision-based methods are commonly used in robotic arm activity recognition. These approaches typically rely on line-of-sight (LoS) and raise privacy concerns, particularly in smart home applications. Passive Wi-Fi sensing represents a new paradigm for recognizing human and robotic arm activities, utilizing channel state information (CSI) measurements to identify activities in indoor environments. In this paper, a novel machine learning approach based on discrete wavelet transform and vision transformers for robotic arm activity recognition from CSI measurements in indoor settings is proposed. This method outperforms convolutional neural network (CNN) and long short-term memory (LSTM) models in robotic arm activity recognition, particularly when LoS is obstructed by barriers, without relying on external or internal sensors or visual aids. Experiments are conducted using four different data collection scenarios and four different robotic arm activities. Performance results demonstrate that wavelet transform can significantly enhance the accuracy of visual transformer networks in robotic arms activity recognition.

arxiv情報

著者 Rojin Zandi,Kian Behzad,Elaheh Motamedi,Hojjat Salehinejad,Milad Siami
発行日 2024-07-08 17:28:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク