A Baseline Framework for Part-level Action Parsing and Action Recognition


このテクニカル レポートでは、ICCV DeeperAction Workshop 2021 の Part-level Action Parsing での Kinetics-TPS Track の第 2 位のソリューションを紹介します。私たちのエントリは、主に、インスタンスとパーツ検出の YOLOF、人間の姿勢推定の HRNet、およびビデオ レベルの CSN に基づいています。
Kinetics-TPS データセットの技術的な詳細と、いくつかの実験結果について説明します。
コンテストでは、Kinetics-TPS のテスト セットで 61.37% の mAP を達成しました。


This technical report introduces our 2nd place solution to Kinetics-TPS Track on Part-level Action Parsing in ICCV DeeperAction Workshop 2021. Our entry is mainly based on YOLOF for instance and part detection, HRNet for human pose estimation, and CSN for video-level action recognition and frame-level part state parsing. We describe technical details for the Kinetics-TPS dataset, together with some experimental results. In the competition, we achieved 61.37% mAP on the test set of Kinetics-TPS.


著者 Xiaodong Chen,Xinchen Liu,Kun Liu,Wu Liu,Tao Mei
発行日 2022-09-01 13:47:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク