要約
近年、Wi-Fi Sensingは、プライバシー保護、低コスト、浸透能力など、多くの利点のために大きな注目を集めています。
この分野では、ジェスチャー認識、人々の識別、転倒検出などの分野に焦点を当てた広範な研究が行われています。
ただし、多くのデータ駆動型の方法は、トレーニングデータとは異なる環境でモデルがうまく機能しないドメインシフトに関連する課題に遭遇します。
この問題に貢献する主な要因の1つは、Wi-Fi Sensingデータセットの利用可能性が限られていることです。これにより、モデルは過度の無関係な情報を学習し、トレーニングセットに過剰に適合します。
残念ながら、多様なシナリオ全体で大規模なWi-Fi Sensingデータセットを収集することは困難な作業です。
この問題に対処するために、少数のショット、ゼロショットシナリオなど、ドメイン内のシナリオとクロスドメインシナリオの両方で優れたシャムネットワークベースのアプローチであるCrossFiを提案し、さらには少数のショットの新しいクラスシナリオでも機能します。
テストセットには新しいカテゴリが含まれています。
CrossFiのコアコンポーネントは、CSI-NETと呼ばれるサンプルシミラリティ計算ネットワークであり、距離やコサインの類似性を単純に計算する代わりに、注意メカニズムを使用して類似情報をキャプチャすることにより、シャムネットワークの構造を改善します。
それに基づいて、クラスごとにテンプレートを生成できる追加のウェイトネットを開発し、CrossFiがさまざまなシナリオで動作できるようにします。
実験結果は、CrossFiがさまざまなシナリオで最先端のパフォーマンスを達成することを示しています。
ジェスチャー認識タスクでは、CrossFiはドメイン内シナリオで98.17%、ワンショットクロスドメインシナリオで91.72%、ゼロショットクロスドメインシナリオで64.81%、ワンショットの新規で84.75%を達成します。
クラスシナリオ。
モデルのコードは、https://github.com/rs2002/crossfiで公開されています。
要約(オリジナル)
In recent years, Wi-Fi sensing has garnered significant attention due to its numerous benefits, such as privacy protection, low cost, and penetration ability. Extensive research has been conducted in this field, focusing on areas such as gesture recognition, people identification, and fall detection. However, many data-driven methods encounter challenges related to domain shift, where the model fails to perform well in environments different from the training data. One major factor contributing to this issue is the limited availability of Wi-Fi sensing datasets, which makes models learn excessive irrelevant information and over-fit to the training set. Unfortunately, collecting large-scale Wi-Fi sensing datasets across diverse scenarios is a challenging task. To address this problem, we propose CrossFi, a siamese network-based approach that excels in both in-domain scenario and cross-domain scenario, including few-shot, zero-shot scenarios, and even works in few-shot new-class scenario where testing set contains new categories. The core component of CrossFi is a sample-similarity calculation network called CSi-Net, which improves the structure of the siamese network by using an attention mechanism to capture similarity information, instead of simply calculating the distance or cosine similarity. Based on it, we develop an extra Weight-Net that can generate a template for each class, so that our CrossFi can work in different scenarios. Experimental results demonstrate that our CrossFi achieves state-of-the-art performance across various scenarios. In gesture recognition task, our CrossFi achieves an accuracy of 98.17% in in-domain scenario, 91.72% in one-shot cross-domain scenario, 64.81% in zero-shot cross-domain scenario, and 84.75% in one-shot new-class scenario. The code for our model is publicly available at https://github.com/RS2002/CrossFi.
arxiv情報
著者 | Zijian Zhao,Tingwei Chen,Zhijie Cai,Xiaoyang Li,Hang Li,Qimei Chen,Guangxu Zhu |
発行日 | 2025-02-14 11:12:02+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google