要約
モーション計画の問題には、ロボットの開始からターゲット構成までの衝突のないパスを見つけることが含まれます。
最近、高価な専門家のデモンストレーションを必要とせずに、モーション計画の問題に取り組むために、自己監督の学習方法が現れました。
それらは、ニューラルネットワークをトレーニングするためのエイコナル方程式を解き、効率的なソリューションにつながります。
ただし、これらの方法は、最適な値関数や測地線距離など、エイコナル方程式の重要な特性を維持できないため、複雑な環境で苦労しています。
これらの制限を克服するために、エイコン方程式をより正確に解決し、複雑で目に見えない計画タスクを解決するパフォーマンスを向上させる新しい自己監視時間の時間差メトリック学習アプローチを提案します。
私たちの方法は、ベルマンの有限領域にわたる最適性の原則を強制します。時間的差異学習を使用して、エイコナル方程式の必須測地特性を保存するためにメトリック学習を組み込んでいる間、偽の局所的最小値を避けます。
私たちのアプローチは、複雑な環境の取り扱いと目に見えない環境への一般化において、既存の自己監視学習方法を大幅に上回ることを実証します。
要約(オリジナル)
The motion planning problem involves finding a collision-free path from a robot’s starting to its target configuration. Recently, self-supervised learning methods have emerged to tackle motion planning problems without requiring expensive expert demonstrations. They solve the Eikonal equation for training neural networks and lead to efficient solutions. However, these methods struggle in complex environments because they fail to maintain key properties of the Eikonal equation, such as optimal value functions and geodesic distances. To overcome these limitations, we propose a novel self-supervised temporal difference metric learning approach that solves the Eikonal equation more accurately and enhances performance in solving complex and unseen planning tasks. Our method enforces Bellman’s principle of optimality over finite regions, using temporal difference learning to avoid spurious local minima while incorporating metric learning to preserve the Eikonal equation’s essential geodesic properties. We demonstrate that our approach significantly outperforms existing self-supervised learning methods in handling complex environments and generalizing to unseen environments, with robot configurations ranging from 2 to 12 degrees of freedom (DOF).
arxiv情報
著者 | Ruiqi Ni,Zherong Pan,Ahmed H Qureshi |
発行日 | 2025-05-09 00:02:22+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google