BON: An extended public domain dataset for human activity recognition


装着型の一人称視点 (FPV) カメラにより、被験者の視点から環境に関する豊富な情報源を抽出できます。
ただし、ウェアラブルカメラベースの自己中心的なオフィス活動の理解に関する研究の進歩は、他の活動環境 (キッチンや屋外の歩行者など) と比較して遅いです。
このペーパーでは、バルセロナ (スペイン)、オックスフォード (英国)、ナイロビ (ケニア) の 3 つの地理的な場所のさまざまなオフィス設定で、胸に取り付けられた GoPro Hero カメラを使用して収集された、公開されている大規模なオフィス アクティビティ データセット (BON) の詳細を説明します。
BON データセットには、18 の一般的なオフィス活動が含まれており、これらは、人と人とのやり取り (同僚とのチャットなど)、人と物 (ホワイトボードへの書き込みなど)、および固有受容 (ウォーキングなど) に分類できます。
注釈は、5 秒間のビデオの各セグメントに提供されます。
通常、BON には 25 のサブジェクトと合計 2639 のセグメントが含まれます。


Body-worn first-person vision (FPV) camera enables to extract a rich source of information on the environment from the subject’s viewpoint. However, the research progress in wearable camera-based egocentric office activity understanding is slow compared to other activity environments (e.g., kitchen and outdoor ambulatory), mainly due to the lack of adequate datasets to train more sophisticated (e.g., deep learning) models for human activity recognition in office environments. This paper provides details of a large and publicly available office activity dataset (BON) collected in different office settings across three geographical locations: Barcelona (Spain), Oxford (UK) and Nairobi (Kenya), using a chest-mounted GoPro Hero camera. The BON dataset contains eighteen common office activities that can be categorised into person-to-person interactions (e.g., Chat with colleagues), person-to-object (e.g., Writing on a whiteboard), and proprioceptive (e.g., Walking). Annotation is provided for each segment of video with 5-seconds duration. Generally, BON contains 25 subjects and 2639 total segments. In order to facilitate further research in the sub-domain, we have also provided results that could be used as baselines for future studies.


著者 Girmaw Abebe Tadesse,Oliver Bent,Komminist Weldemariam,Md. Abrar Istiak,Taufiq Hasan,Andrea Cavallaro
発行日 2022-09-12 08:28:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV, eess.IV パーマリンク