要約
テキスト駆動型のモーションジェネレーションは、自然言語から直接人間の動きを作成するための強力で直感的な方法を提供します。
事前定義されたモーション入力の必要性を削除することにより、アニメーション文字を制御するための柔軟でアクセス可能なアプローチを提供します。
これにより、バーチャルリアリティ、ゲーム、ヒューマンコンピューターの相互作用、ロボット工学などの分野で特に役立ちます。
このレビューでは、最初にモーション合成に関する従来の視点を再検討します。モデルは、しばしばアクションラベルを条件付けられた観測された初期シーケンスから将来のポーズを予測することに焦点を合わせました。
次に、最新のテキストからモーションの生成アプローチに関する包括的で構造化された調査を提供し、2つの補完的な観点から分類します。
(ii)モーション表現、離散および連続運動生成戦略を区別する。
さらに、この分野で進行状況を形作った最も広く使用されているデータセット、評価方法、および最近のベンチマークを探ります。
この調査により、この分野が現在の場所を把握し、その重要な課題と制限に注意を向け、将来の探求のための有望な方向性を強調することを目指しています。
この作品が、言語主導の人間の動きの統合の境界を押し広げるために働く研究者と実践者に貴重な出発点を提供することを願っています。
要約(オリジナル)
Text-driven motion generation offers a powerful and intuitive way to create human movements directly from natural language. By removing the need for predefined motion inputs, it provides a flexible and accessible approach to controlling animated characters. This makes it especially useful in areas like virtual reality, gaming, human-computer interaction, and robotics. In this review, we first revisit the traditional perspective on motion synthesis, where models focused on predicting future poses from observed initial sequences, often conditioned on action labels. We then provide a comprehensive and structured survey of modern text-to-motion generation approaches, categorizing them from two complementary perspectives: (i) architectural, dividing methods into VAE-based, diffusion-based, and hybrid models; and (ii) motion representation, distinguishing between discrete and continuous motion generation strategies. In addition, we explore the most widely used datasets, evaluation methods, and recent benchmarks that have shaped progress in this area. With this survey, we aim to capture where the field currently stands, bring attention to its key challenges and limitations, and highlight promising directions for future exploration. We hope this work offers a valuable starting point for researchers and practitioners working to push the boundaries of language-driven human motion synthesis.
arxiv情報
著者 | Ali Rida Sahili,Najett Neji,Hedi Tabia |
発行日 | 2025-05-14 13:33:12+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google