Statistical Keystroke Synthesis for Improved Bot Detection

要約

この作業は、ユニバーサルモデルとユーザー依存モデルに基づいてキーストローク生体認証データを合成するための2つの統計的アプローチを提案します。
どちらのアプローチも、ボット検出タスクで検証され、キーストローク合成データを使用してシステムをより適切にトレーニングします。
私たちの実験には、168,000人の被験者からの1億3600万のキーストロークイベントを含むデータセットが含まれています。
定性的および定量的実験を通じて、2つの合成アプローチのパフォーマンスを分析しました。
2つの教師あり分類器(サポートベクターマシンと長短期記憶ネットワーク)と、人間と生成されたサンプルを含む学習フレームワークに基づいて、さまざまなボット検出器が検討されます。
私たちの結果は、提案された統計的アプローチが現実的な人間のような合成キーストロークサンプルを生成できることを証明しています。
また、分類結果は、ラベル付けされたデータが大きいシナリオでは、これらの合成サンプルを高精度で検出できることを示しています。
ただし、数ショットの学習シナリオでは、これは重要な課題となります。

要約(オリジナル)

This work proposes two statistical approaches for the synthesis of keystroke biometric data based on Universal and User-dependent Models. Both approaches are validated on the bot detection task, using the keystroke synthetic data to better train the systems. Our experiments include a dataset with 136 million keystroke events from 168,000 subjects. We have analyzed the performance of the two synthesis approaches through qualitative and quantitative experiments. Different bot detectors are considered based on two supervised classifiers (Support Vector Machine and Long Short-Term Memory network) and a learning framework including human and generated samples. Our results prove that the proposed statistical approaches are able to generate realistic human-like synthetic keystroke samples. Also, the classification results suggest that in scenarios with large labeled data, these synthetic samples can be detected with high accuracy. However, in few-shot learning scenarios it represents an important challenge.

arxiv情報

著者 Daniel DeAlcala,Aythami Morales,Ruben Tolosana,Alejandro Acien,Julian Fierrez,Santiago Hernandez,Miguel A. Ferrer,Moises Diaz
発行日 2022-07-28 06:59:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク