NUMOSIM: A Synthetic Mobility Dataset with Anomaly Detection Benchmarks

要約

現実世界のモビリティ データを収集するのは困難です。
多くの場合、プライバシーへの懸念、ロジスティック上の困難、固有の偏見を伴います。
さらに、微妙で複雑なパターンを区別するには細心の注意を払う必要があるため、大規模データの異常に正確にアノテーションを付けることはほぼ不可能です。
これらの課題は、信頼できるデータへのアクセスを制限し、方法論の厳密な評価、比較、ベンチマークを複雑にすることにより、地理空間異常検出研究の進歩を大きく妨げています。
これらの制限に対処するために、異常検出技術のベンチマークのための、制御された倫理的で多様な環境を提供する合成モビリティ データセット NUMOSIM を導入します。
NUMOSIM は、実際のモビリティ データでトレーニングされた高度な深層学習モデルを通じて生成された、典型的な動作と異常な動作の両方を含む、幅広い現実的なモビリティ シナリオをシミュレートします。
このアプローチにより、NUMOSIM は現実世界の移動パターンの複雑さを正確に再現しながら、異常を戦略的に注入して、人口動態、地理空間、時間的要因の間の相互作用をどの程度効果的に捉えるかに基づいて検出アルゴリズムに挑戦し、評価することができます。
私たちの目標は、異常検出とモビリティ モデリング技術を改善するための現実的なベンチマークを提供することにより、地理空間モビリティ分析を進歩させることです。
これをサポートするために、包括的なドキュメント、評価指標、ベンチマーク結果とともに、NUMOSIM データセットへのオープン アクセスを提供します。

要約(オリジナル)

Collecting real-world mobility data is challenging. It is often fraught with privacy concerns, logistical difficulties, and inherent biases. Moreover, accurately annotating anomalies in large-scale data is nearly impossible, as it demands meticulous effort to distinguish subtle and complex patterns. These challenges significantly impede progress in geospatial anomaly detection research by restricting access to reliable data and complicating the rigorous evaluation, comparison, and benchmarking of methodologies. To address these limitations, we introduce a synthetic mobility dataset, NUMOSIM, that provides a controlled, ethical, and diverse environment for benchmarking anomaly detection techniques. NUMOSIM simulates a wide array of realistic mobility scenarios, encompassing both typical and anomalous behaviours, generated through advanced deep learning models trained on real mobility data. This approach allows NUMOSIM to accurately replicate the complexities of real-world movement patterns while strategically injecting anomalies to challenge and evaluate detection algorithms based on how effectively they capture the interplay between demographic, geospatial, and temporal factors. Our goal is to advance geospatial mobility analysis by offering a realistic benchmark for improving anomaly detection and mobility modeling techniques. To support this, we provide open access to the NUMOSIM dataset, along with comprehensive documentation, evaluation metrics, and benchmark results.

arxiv情報

著者 Chris Stanford,Suman Adari,Xishun Liao,Yueshuai He,Qinhua Jiang,Chenchen Kuai,Jiaqi Ma,Emmanuel Tung,Yinlong Qian,Lingyi Zhao,Zihao Zhou,Zeeshan Rasheed,Khurram Shafique
発行日 2024-09-06 16:55:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク