要約
私たちは、断続的な共有実行エクスペリエンスと、特に人間の制御不能な性質による人間とロボットの間の大きな信念の相違を伴うシナリオに合わせて調整された、人間を意識したタスク プランニング フレームワークの大幅な拡張を提示します。
私たちの目的は、制御不能な人間の行動を考慮したロボット ポリシーを構築し、実行が共有されていない場合でもロボットによって達成される可能性のある進歩を予測できるようにすることです。
サブタスクを完了するために人間が共有環境から一時的に離れるとき。
しかし、この予測は、ロボットの推定モデルにアクセスできる人間の観点から考慮されています。
この目的のために、我々は新しい計画フレームワークを提案し、視点取得による状況評価を含む知識推論を統合するAND-OR検索に基づくソルバーを構築します。
私たちのアプローチは、エージェントがタスク実行エクスペリエンスをいつ共有するのか (いつ共有しないのか) を正確に追跡しながら、潜在的な進歩の拡大と縮小を動的にモデル化および管理します。
プランナーは状況を体系的に評価し、人間には不可能だと考える理由がある世界を無視します。
全体として、私たちの新しいソルバーは、潜在的な行動方針に沿って人間とロボットの異なる信念を推定することができ、ロボットがコミュニケーションのための適切な瞬間を選択する計画の統合を可能にします。つまり、情報を提供したり、問い合わせに返信したり、または日常的な行動を延期したりすることができます。
実行経験を共有できるようになるまで。
1 つは新規、もう 1 つは適応した 2 つの領域での予備実験により、フレームワークの有効性が実証されました。
要約(オリジナル)
We present a substantial extension of our Human-Aware Task Planning framework, tailored for scenarios with intermittent shared execution experiences and significant belief divergence between humans and robots, particularly due to the uncontrollable nature of humans. Our objective is to build a robot policy that accounts for uncontrollable human behaviors, thus enabling the anticipation of possible advancements achieved by the robot when the execution is not shared, e.g. when humans are briefly absent from the shared environment to complete a subtask. But, this anticipation is considered from the perspective of humans who have access to an estimated model for the robot. To this end, we propose a novel planning framework and build a solver based on AND-OR search, which integrates knowledge reasoning, including situation assessment by perspective taking. Our approach dynamically models and manages the expansion and contraction of potential advances while precisely keeping track of when (and when not) agents share the task execution experience. The planner systematically assesses the situation and ignores worlds that it has reason to think are impossible for humans. Overall, our new solver can estimate the distinct beliefs of the human and the robot along potential courses of action, enabling the synthesis of plans where the robot selects the right moment for communication, i.e. informing, or replying to an inquiry, or defers ontic actions until the execution experiences can be shared. Preliminary experiments in two domains, one novel and one adapted, demonstrate the effectiveness of the framework.
arxiv情報
著者 | Shashank Shekhar,Anthony Favier,Rachid Alami |
発行日 | 2024-09-27 08:27:36+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google