Automatic Interaction and Activity Recognition from Videos of Human Manual Demonstrations with Application to Anomaly Detection


このアプローチでは、シーン グラフを利用して画像シーケンスから重要なインタラクション特徴を抽出し、同時にモーション パターンとコンテキストをエンコードします。
このアプローチの有効性は 2 つの複数被験者実験で実証され、アクティビティに関する事前知識がなくても手と物体および物体と物体の相互作用を認識してクラスタリングできること、および異なる被験者が実行した同じアクティビティを照合する能力が示されました。


This paper presents a new method to describe spatio-temporal relations between objects and hands, to recognize both interactions and activities within video demonstrations of manual tasks. The approach exploits Scene Graphs to extract key interaction features from image sequences while simultaneously encoding motion patterns and context. Additionally, the method introduces event-based automatic video segmentation and clustering, which allow for the grouping of similar events and detect if a monitored activity is executed correctly. The effectiveness of the approach was demonstrated in two multi-subject experiments, showing the ability to recognize and cluster hand-object and object-object interactions without prior knowledge of the activity, as well as matching the same activity performed by different subjects.


著者 Elena Merlo,Marta Lagomarsino,Edoardo Lamon,Arash Ajoudani
発行日 2023-07-07 08:31:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV, cs.RO パーマリンク