Generation of Geodesics with Actor-Critic Reinforcement Learning to Predict Midpoints

要約

無限に定義されたメトリックを備えたマニホールド上のすべてのペアのすべてのペアの最短パスを見つけるために、中間点を再帰的に予測することにより、それらを生成するフレームワークを紹介します。
Midpointの予測を学ぶために、俳優と批判的なアプローチを提案します。
私たちはアプローチの健全性を証明し、提案された方法が複雑な運動学を持つエージェントのパス計画や、複数のフリードムロボットアームのモーション計画など、いくつかの計画タスクの既存の方法よりも優れていることを実験的に示します。

要約(オリジナル)

To find the shortest paths for all pairs on manifolds with infinitesimally defined metrics, we introduce a framework to generate them by predicting midpoints recursively. To learn midpoint prediction, we propose an actor-critic approach. We prove the soundness of our approach and show experimentally that the proposed method outperforms existing methods on several planning tasks, including path planning for agents with complex kinematics and motion planning for multi-degree-of-freedom robot arms.

arxiv情報

著者 Kazumi Kasaura
発行日 2025-03-21 14:44:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク