Optimal Interactive Learning on the Job via Facility Location Planning

要約

共同ロボットは、ユーザーに過剰に負担することなく、新しいタスクやユーザーの好みに継続的に適応する必要があります。
以前のインタラクティブなロボット学習方法は、人間の努力を減らすことを目的としていますが、通常、シングルタスクシナリオに限定されており、持続的なマルチタスクコラボレーションには適していません。
コイル(コスト最適なインタラクティブ学習)を提案します。これは、3つのクエリタイプ(スキル、好み、およびヘルプ)を戦略的に選択することにより、一連のタスク全体で人間の努力を最小限に抑えるマルチタスクインタラクションプランナーです。
ユーザーの好みがわかっている場合、コイルを耐パシッテーション施設の位置(UFL)問題として策定します。これにより、既製の近似アルゴリズムを使用して、多項式時間で境界線型計画を可能にします。
これらの近似アルゴリズムをサブルーチンとして使用して多項式時間のパフォーマンスを維持することにより、1段階の信念スペース計画を組み込むことにより、ユーザーの好みの不確実性を処理するように定式化を拡張します。
操作タスクに関するシミュレーションおよび物理実験は、私たちのフレームワークが、タスクの完了を成功させながら、人間に割り当てる作業の量を大幅に削減することを示しています。

要約(オリジナル)

Collaborative robots must continually adapt to novel tasks and user preferences without overburdening the user. While prior interactive robot learning methods aim to reduce human effort, they are typically limited to single-task scenarios and are not well-suited for sustained, multi-task collaboration. We propose COIL (Cost-Optimal Interactive Learning) — a multi-task interaction planner that minimizes human effort across a sequence of tasks by strategically selecting among three query types (skill, preference, and help). When user preferences are known, we formulate COIL as an uncapacitated facility location (UFL) problem, which enables bounded-suboptimal planning in polynomial time using off-the-shelf approximation algorithms. We extend our formulation to handle uncertainty in user preferences by incorporating one-step belief space planning, which uses these approximation algorithms as subroutines to maintain polynomial-time performance. Simulated and physical experiments on manipulation tasks show that our framework significantly reduces the amount of work allocated to the human while maintaining successful task completion.

arxiv情報

著者 Shivam Vats,Michelle Zhao,Patrick Callaghan,Mingxi Jia,Maxim Likhachev,Oliver Kroemer,George Konidaris
発行日 2025-05-01 12:45:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク