pose-format: Library for Viewing, Augmenting, and Handling .pose Files

要約

ポーズ データの管理と分析は複雑なタスクであり、さまざまなファイル構造やデータ タイプの処理から、正規化や拡張などの効果的なデータ操作の促進に至るまで、さまざまな課題があります。
このペーパーでは、統一された柔軟で使いやすいインターフェイスを提供することで、これらの課題に対処するように設計された包括的なツールキットである \texttt{pose-format} について説明します。
このライブラリには、さまざまなタイプのポーズ データをカプセル化する特殊なファイル形式が含まれており、複数の個人や無期限のタイム フレームに対応できるため、画像データとビデオ データの両方でその有用性が証明されています。
さらに、NumPy、PyTorch、TensorFlow などの一般的な数値ライブラリとのシームレスな統合を提供するため、堅牢な機械学習アプリケーションが可能になります。
ベンチマークを通じて、\texttt{.pose} ファイル形式が OpenPose などの一般的な形式に対して非常に優れたパフォーマンスを提供し、自己完結型のポーズ仕様などの利点も備えていることを実証しました。
さらに、このライブラリには、Python 環境とブラウザ環境の両方で、データの正規化、拡張、および使いやすい視覚化機能の機能が含まれています。
\texttt{pose-format} は、ポーズ データの管理と分析の複雑さを合理化するワンストップ ソリューションとして登場します。

要約(オリジナル)

Managing and analyzing pose data is a complex task, with challenges ranging from handling diverse file structures and data types to facilitating effective data manipulations such as normalization and augmentation. This paper presents \texttt{pose-format}, a comprehensive toolkit designed to address these challenges by providing a unified, flexible, and easy-to-use interface. The library includes a specialized file format that encapsulates various types of pose data, accommodating multiple individuals and an indefinite number of time frames, thus proving its utility for both image and video data. Furthermore, it offers seamless integration with popular numerical libraries such as NumPy, PyTorch, and TensorFlow, thereby enabling robust machine-learning applications. Through benchmarking, we demonstrate that our \texttt{.pose} file format offers vastly superior performance against prevalent formats like OpenPose, with added advantages like self-contained pose specification. Additionally, the library includes features for data normalization, augmentation, and easy-to-use visualization capabilities, both in Python and Browser environments. \texttt{pose-format} emerges as a one-stop solution, streamlining the complexities of pose data management and analysis.

arxiv情報

著者 Amit Moryossef,Mathias Müller,Rebecka Fahrni
発行日 2023-10-13 12:41:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク