Toward Reliable Human Pose Forecasting with Uncertainty

要約

最近、過去に観察された一連の人物の 3D ポーズを前提として、人の将来の 3D ポーズのシーケンスを予測するという時空間的タスクを解決することを目的とした姿勢予測手法の軍拡競争が行われています。
しかし、統一されたベンチマークの欠如と不確実性分析が限られているため、この分野の進歩は妨げられています。
これに対処するために、私たちはまず、研究を促進し、統一的で一貫した評価に向けて進むことを目的として、複数のモデルを含み、複数のデータセットをサポートし、標準化された評価指標を採用する人間の姿勢予測のためのオープンソース ライブラリを開発します。
次に、パフォーマンスを向上させ、より良い信頼を伝えるために、問題における 2 つのタイプの不確実性を考案します。 1) 不確実性の事前分布を使用して不確実性のパターンに関する知識を注入することにより、偶然の不確実性をモデル化する方法を提案します。
これにより、学習されたパラメーターの数が減り、安定性が向上しながら、より有意義な監視の方向にモデルの能力が集中します。
2) クラスタリングとその割り当てのエントロピーの測定を通じて、任意のモデルの認識論的不確実性を定量化するための新しいアプローチを導入します。
私たちの実験では、Human3.6M、AMSS、および 3DPW データセットにおいて、短期期間での予測が最大 25\%$ 改善され、長期期間では損失がなく、不確実性推定のパフォーマンスが向上することが実証されました。
コードはオンライン https://github.com/vita-epfl/UnPOSed で入手できます。

要約(オリジナル)

Recently, there has been an arms race of pose forecasting methods aimed at solving the spatio-temporal task of predicting a sequence of future 3D poses of a person given a sequence of past observed ones. However, the lack of unified benchmarks and limited uncertainty analysis have hindered progress in the field. To address this, we first develop an open-source library for human pose forecasting, including multiple models, supporting several datasets, and employing standardized evaluation metrics, with the aim of promoting research and moving toward a unified and consistent evaluation. Second, we devise two types of uncertainty in the problem to increase performance and convey better trust: 1) we propose a method for modeling aleatoric uncertainty by using uncertainty priors to inject knowledge about the pattern of uncertainty. This focuses the capacity of the model in the direction of more meaningful supervision while reducing the number of learned parameters and improving stability; 2) we introduce a novel approach for quantifying the epistemic uncertainty of any model through clustering and measuring the entropy of its assignments. Our experiments demonstrate up to $25\%$ improvements in forecasting at short horizons, with no loss on longer horizons on Human3.6M, AMSS, and 3DPW datasets, and better performance in uncertainty estimation. The code is available online at https://github.com/vita-epfl/UnPOSed.

arxiv情報

著者 Saeed Saadatnejad,Mehrshad Mirmohammadi,Matin Daghyani,Parham Saremi,Yashar Zoroofchi Benisi,Amirhossein Alimohammadi,Zahra Tehraninasab,Taylor Mordan,Alexandre Alahi
発行日 2024-04-12 11:56:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.HC, cs.RO パーマリンク