要約
共有自律性は、直接制御することが不可能ではないにしても困難なロボットに対する制御権限をユーザーに提供する有効化テクノロジーです。
しかし、標準的な方法では、実践の例での採用を制限する仮定、ユーザーの目標または最適化を希望する目的(つまり、報酬)機能、ユーザーのポリシーの知識、またはトレーニング中のユーザーへのクエリレベルのアクセスを想定しています。
共有された自律性への拡散ベースのアプローチは、そのような仮定を行うことはなく、代わりにユーザーが制御権限を維持できるようにしながら、望ましい行動のデモンストレーションへのアクセスのみを必要とします。
ただし、これらの利点は、高い計算の複雑さを犠牲にしてもたらされており、リアルタイムの共有自律性が不可能になりました。
この制限を克服するために、拡散の一貫性モデルベースの定式化を採用する共有自律型フレームワークである一貫性共有自律性(CSA)を提案します。
CSAの鍵は、通常の微分方程式(PF ODE)の蒸留確率流を使用して、単一のステップで高忠実度サンプルを生成することです。
これにより、共有された自律性に対する以前の拡散ベースのアプローチで可能なものよりも大きな推論速度が発生し、単一の関数評価のみで複雑なドメインでのリアルタイム支援が可能になります。
さらに、PF ODEの中間状態で欠陥のあるアクションに介入することにより、CSAはさまざまなレベルの支援を可能にします。
さまざまな挑戦的なシミュレートされた現実世界のロボット制御の問題でCSAを評価し、タスクのパフォーマンスと計算効率の両方の点で最先端の方法よりも大幅な改善を示しています。
要約(オリジナル)
Shared autonomy is an enabling technology that provides users with control authority over robots that would otherwise be difficult if not impossible to directly control. Yet, standard methods make assumptions that limit their adoption in practice-for example, prior knowledge of the user’s goals or the objective (i.e., reward) function that they wish to optimize, knowledge of the user’s policy, or query-level access to the user during training. Diffusion-based approaches to shared autonomy do not make such assumptions and instead only require access to demonstrations of desired behaviors, while allowing the user to maintain control authority. However, these advantages have come at the expense of high computational complexity, which has made real-time shared autonomy all but impossible. To overcome this limitation, we propose Consistency Shared Autonomy (CSA), a shared autonomy framework that employs a consistency model-based formulation of diffusion. Key to CSA is that it employs the distilled probability flow of ordinary differential equations (PF ODE) to generate high-fidelity samples in a single step. This results in inference speeds significantly than what is possible with previous diffusion-based approaches to shared autonomy, enabling real-time assistance in complex domains with only a single function evaluation. Further, by intervening on flawed actions at intermediate states of the PF ODE, CSA enables varying levels of assistance. We evaluate CSA on a variety of challenging simulated and real-world robot control problems, demonstrating significant improvements over state-of-the-art methods both in terms of task performance and computational efficiency.
arxiv情報
著者 | Luzhe Sun,Jingtian Ji,Xiangshan Tan,Matthew R. Walter |
発行日 | 2025-05-22 16:50:53+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google