Autoregressive Meta-Actions for Unified Controllable Trajectory Generation

要約

メタアクションと呼ばれる高レベルのセマンティック決定に導かれた制御可能な軌跡の生成は、自律的な駆動システムにとって重要です。
既存のフレームワークの重要な制限は、固定された将来の時間間隔で割り当てられた不変のメタアクションに依存し、実際の動作軌跡との時間的不整列を引き起こすことです。
この不整合は、規定されたメタ作用と結果として生じる軌道との間の無関係な関連性につながり、タスクの一貫性を破壊し、モデルのパフォーマンスを制限します。
この課題に対処するために、自己回帰メタアクションを導入します。これは、メタアクションコンディショニングされた軌跡予測の統一された正確な定義を提供する自己回帰軌道生成フレームワークに統合されたアプローチです。
具体的には、従来の長い間隔のメタアクションをフレームレベルのメタアクションに分解し、自己回帰メタアクション予測とメタアクション条件の軌跡生成との間の連続的な相互作用を可能にします。
この分解により、各軌道セグメントとそれに対応するメタアクションとの間の厳密なアライメントが保証され、軌道スパン全体にわたって一貫した統一されたタスク定式化が達成され、複雑さが大幅に削減されます。
さらに、柔軟性、安定性、モジュール性を提供する高レベルの意思決定制御の統合から基本的なモーションダイナミクスの学習を分離するための段階的なトレーニングプロセスを提案します。
実験結果は、フレームワークの有効性を検証し、軌道適応性の改善と動的な意思決定シナリオに対する応答性を示しています。
https://arma-traj.github.io/で入手できるビデオドキュメントとデータセットを提供します。

要約(オリジナル)

Controllable trajectory generation guided by high-level semantic decisions, termed meta-actions, is crucial for autonomous driving systems. A significant limitation of existing frameworks is their reliance on invariant meta-actions assigned over fixed future time intervals, causing temporal misalignment with the actual behavior trajectories. This misalignment leads to irrelevant associations between the prescribed meta-actions and the resulting trajectories, disrupting task coherence and limiting model performance. To address this challenge, we introduce Autoregressive Meta-Actions, an approach integrated into autoregressive trajectory generation frameworks that provides a unified and precise definition for meta-action-conditioned trajectory prediction. Specifically, We decompose traditional long-interval meta-actions into frame-level meta-actions, enabling a sequential interplay between autoregressive meta-action prediction and meta-action-conditioned trajectory generation. This decomposition ensures strict alignment between each trajectory segment and its corresponding meta-action, achieving a consistent and unified task formulation across the entire trajectory span and significantly reducing complexity. Moreover, we propose a staged pre-training process to decouple the learning of basic motion dynamics from the integration of high-level decision control, which offers flexibility, stability, and modularity. Experimental results validate our framework’s effectiveness, demonstrating improved trajectory adaptivity and responsiveness to dynamic decision-making scenarios. We provide the video document and dataset, which are available at https://arma-traj.github.io/.

arxiv情報

著者 Jianbo Zhao,Taiyu Ban,Xiyang Wang,Qibin Zhou,Hangning Zhou,Zhihao Liu,Mu Yang,Lei Liu,Bin Li
発行日 2025-05-29 16:19:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク