Bluetooth and WiFi Dataset for Real World RF Fingerprinting of Commercial Devices

要約

RF フィンガープリンティングは、RF スペクトルを共有する不正または無許可のエミッタを識別するための物理層セキュリティ方式として登場しつつあります。
しかし、公的にアクセス可能な現実世界のデータセットが不足しているため、ほとんどの研究は、実際の展開設定には適していないソフトウェア無線機 (SDR) を使用して合成波形を生成することに焦点を当てています。
一方、利用可能なデータセットは限られており、1 種類の波形のみを生成するチップセットのみに焦点を当てています。
ラップトップ、アダプター、ワイヤレス充電器、Raspberry Pi などに搭載されている共有デュアルバンド アンテナを介して 2 つのワイヤレス規格 (WiFi と Bluetooth など) をサポートする商用既製 (COTS) コンボ チップセットが普及しつつあります。
IoTの領域で。
したがって、最新の IoT 環境に対応するためには、異種通信プロトコルを送信するコンボ チップセットからの放出を捕捉する現実世界のオープン データセットが急務となっています。
この目的を達成するために、2 つの異なる時間枠で WiFi と Bluetooth を送信する COTS IoT チップセットからの最初の既知の放射を捕捉しました。
モデルの汎化能力を厳密に評価するには、さまざまな時間枠が不可欠です。
広く使用できるように、包括的な 72 GB データセット内の各キャプチャは、多様な入力テンソルの長さと形式をサポートするのに十分な長さ (40 MSamples) になっています。
最後に、データセットには、現実の環境で遭遇するような弱い信号強度から高い信号強度の放射を考慮して、さまざまな信号パワーでの放射も含まれ​​ています。

要約(オリジナル)

RF fingerprinting is emerging as a physical layer security scheme to identify illegitimate and/or unauthorized emitters sharing the RF spectrum. However, due to the lack of publicly accessible real-world datasets, most research focuses on generating synthetic waveforms with software-defined radios (SDRs) which are not suited for practical deployment settings. On other hand, the limited datasets that are available focus only on chipsets that generate only one kind of waveform. Commercial off-the-shelf (COTS) combo chipsets that support two wireless standards (for example WiFi and Bluetooth) over a shared dual-band antenna such as those found in laptops, adapters, wireless chargers, Raspberry Pis, among others are becoming ubiquitous in the IoT realm. Hence, to keep up with the modern IoT environment, there is a pressing need for real-world open datasets capturing emissions from these combo chipsets transmitting heterogeneous communication protocols. To this end, we capture the first known emissions from the COTS IoT chipsets transmitting WiFi and Bluetooth under two different time frames. The different time frames are essential to rigorously evaluate the generalization capability of the models. To ensure widespread use, each capture within the comprehensive 72 GB dataset is long enough (40 MSamples) to support diverse input tensor lengths and formats. Finally, the dataset also comprises emissions at varying signal powers to account for the feeble to high signal strength emissions as encountered in a real-world setting.

arxiv情報

著者 Anu Jagannath,Zackary Kane,Jithin Jagannath
発行日 2023-08-16 13:59:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.NI パーマリンク