SensorQA: A Question Answering Benchmark for Daily-Life Monitoring


既存の研究は主に学習分類モデルに焦点を当てていますが、エンドユーザーがセンサー データから有益な洞察をどのように積極的に抽出できるかを調査した研究はほとんどありませんが、適切なデータセットの欠如によって妨げられることがよくあります。
このギャップに対処するために、日常生活モニタリング用の長期時系列センサー データ用に人間が作成した初の質問応答 (QA) データセットである SensorQA を紹介します。
SensorQA は人間の作業者によって作成され、人間の真の関心を反映する 5.6K の多様で実用的なクエリと、センサー データから得られる正確な回答が含まれています。
さらに、このデータセットで最先端の AI モデルのベンチマークを確立し、一般的なエッジ デバイスでのパフォーマンスを評価します。
私たちの結果は、現在のモデルと最適な QA パフォーマンスおよび効率の間にギャップがあることを明らかにし、新たな貢献の必要性を浮き彫りにしています。
データセットとコードは \url{} から入手できます。


With the rapid growth in sensor data, effectively interpreting and interfacing with these data in a human-understandable way has become crucial. While existing research primarily focuses on learning classification models, fewer studies have explored how end users can actively extract useful insights from sensor data, often hindered by the lack of a proper dataset. To address this gap, we introduce SensorQA, the first human-created question-answering (QA) dataset for long-term time-series sensor data for daily life monitoring. SensorQA is created by human workers and includes 5.6K diverse and practical queries that reflect genuine human interests, paired with accurate answers derived from sensor data. We further establish benchmarks for state-of-the-art AI models on this dataset and evaluate their performance on typical edge devices. Our results reveal a gap between current models and optimal QA performance and efficiency, highlighting the need for new contributions. The dataset and code are available at: \url{}.


著者 Benjamin Reichman,Xiaofan Yu,Lanxiang Hu,Jack Truxal,Atishay Jain,Rushil Chandrupatla,Tajana Šimunić Rosing,Larry Heck
発行日 2025-01-10 05:15:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CL パーマリンク