要約
近年、Wi-Fi センシングは、プライバシー保護、低コスト、浸透能力などの多くの利点により大きな注目を集めています。
この分野では、ジェスチャー認識、人物識別、転倒検出などの分野に焦点を当てて広範な研究が行われてきました。
ただし、多くのデータ駆動型手法は、トレーニング データとは異なる環境ではモデルが適切に機能しないというドメイン シフトに関連する課題に直面しています。
この問題に寄与する主な要因の 1 つは、Wi-Fi センシング データセットの可用性が限られていることです。これにより、モデルが過剰な無関係な情報を学習し、トレーニング セットに過剰に適合することになります。
残念ながら、さまざまなシナリオにわたって大規模な Wi-Fi センシング データセットを収集するのは困難な作業です。
この問題に対処するために、私たちはシャム ネットワーク ベースのアプローチである CrossFi を提案します。これはドメイン内シナリオとクロスドメイン シナリオ (少数ショット、ゼロショット シナリオを含む) の両方で優れており、少数ショットの新しいクラス シナリオでも機能します。
ここで、テスト セットには新しいカテゴリが含まれています。
CrossFi のコア コンポーネントは、CSi-Net と呼ばれるサンプル類似度計算ネットワークです。これは、単に距離やコサイン類似度を計算するのではなく、アテンション メカニズムを使用して類似度情報を取得することで、シャム ネットワークの構造を改善します。
これに基づいて、CrossFi がさまざまなシナリオで機能できるように、各クラスのテンプレートを生成できる追加の Weight-Net を開発します。
実験結果は、当社の CrossFi がさまざまなシナリオにわたって最先端のパフォーマンスを達成することを示しています。
ジェスチャ認識タスクでは、当社の CrossFi は、ドメイン内シナリオで 98.17%、ワンショット クロスドメイン シナリオで 91.72%、ゼロショット クロスドメイン シナリオで 64.81%、ワンショットの新しいシナリオで 84.75% の精度を達成しました。
クラスシナリオ。
今後の研究を促進するために、公開時にモデルのコードを公開します。
要約(オリジナル)
In recent years, Wi-Fi sensing has garnered significant attention due to its numerous benefits, such as privacy protection, low cost, and penetration ability. Extensive research has been conducted in this field, focusing on areas such as gesture recognition, people identification, and fall detection. However, many data-driven methods encounter challenges related to domain shift, where the model fails to perform well in environments different from the training data. One major factor contributing to this issue is the limited availability of Wi-Fi sensing datasets, which makes models learn excessive irrelevant information and over-fit to the training set. Unfortunately, collecting large-scale Wi-Fi sensing datasets across diverse scenarios is a challenging task. To address this problem, we propose CrossFi, a siamese network-based approach that excels in both in-domain scenario and cross-domain scenario, including few-shot, zero-shot scenarios, and even works in few-shot new-class scenario where testing set contains new categories. The core component of CrossFi is a sample-similarity calculation network called CSi-Net, which improves the structure of the siamese network by using an attention mechanism to capture similarity information, instead of simply calculating the distance or cosine similarity. Based on it, we develop an extra Weight-Net that can generate a template for each class, so that our CrossFi can work in different scenarios. Experimental results demonstrate that our CrossFi achieves state-of-the-art performance across various scenarios. In gesture recognition task, our CrossFi achieves an accuracy of 98.17% in in-domain scenario, 91.72% in one-shot cross-domain scenario, 64.81% in zero-shot cross-domain scenario, and 84.75% in one-shot new-class scenario. To facilitate future research, we will release the code for our model upon publication.
arxiv情報
著者 | Zijian Zhao,Tingwei Chen,Zhijie Cai,Hang Li,Xiaoyang Li,Qimei Chen,Guangxu Zhu |
発行日 | 2024-08-20 15:04:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google