要約
視覚ベースの人間の行動認識は、監視システム、スポーツ分析、医療支援技術、人間とロボットの相互作用フレームワークなど、さまざまな応用分野で見られ、ビデオ内の個人の活動の識別と分類に関係します。
通常、アクションは連続した画像のシーケンス上で発生するため、追加の複雑さのレイヤーを導入する時間分析が含まれるため、特に困難です。
ただし、複数のアプローチで時間解析を処理しようとしていますが、計算コストと適応性の欠如により、依然として困難が伴います。
したがって、次世代ハードウェア センサーによって提供される、連続画像間の遷移情報を含むさまざまな種類の視覚データは、ロボット工学コミュニティが人間の動作認識の問題に取り組む指針となるでしょう。
一方で、研究者が新しい人工知能モデルをトレーニングするために採用できる静止画像データセットは大量にありますが、人間の活動を表すビデオの機能は限られており、たとえばデータセットが小さくバランスが取れていない、または複数のソースから制御なしに選択されているなどです。
この目的を達成するために、データ作成プロセス全体でラベル付けが実行されるため、新しくリアルな合成ビデオを生成することが可能になります。また、強化学習技術により、大幅なデータセットへの依存を回避できます。
同時に、新技術に対する疑念や懸念がすでに存在するため、人的要因の関与は研究コミュニティに倫理的な問題を引き起こします。
要約(オリジナル)
Visual-based human action recognition can be found in various application fields, e.g., surveillance systems, sports analytics, medical assistive technologies, or human-robot interaction frameworks, and it concerns the identification and classification of individuals’ activities within a video. Since actions typically occur over a sequence of consecutive images, it is particularly challenging due to the inclusion of temporal analysis, which introduces an extra layer of complexity. However, although multiple approaches try to handle temporal analysis, there are still difficulties because of their computational cost and lack of adaptability. Therefore, different types of vision data, containing transition information between consecutive images, provided by next-generation hardware sensors will guide the robotics community in tackling the problem of human action recognition. On the other hand, while there is a plethora of still-image datasets, that researchers can adopt to train new artificial intelligence models, videos representing human activities are of limited capabilities, e.g., small and unbalanced datasets or selected without control from multiple sources. To this end, generating new and realistic synthetic videos is possible since labeling is performed throughout the data creation process, while reinforcement learning techniques can permit the avoidance of considerable dataset dependence. At the same time, human factors’ involvement raises ethical issues for the research community, as doubts and concerns about new technologies already exist.
arxiv情報
著者 | Antonios Gasteratos,Stavros N. Moutsis,Konstantinos A. Tsintotas,Yiannis Aloimonos |
発行日 | 2024-12-17 15:07:50+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google