Inductive Learning of Robot Task Knowledge from Raw Data and Online Expert Feedback

要約

ロボットの自律性レベルの向上により、特に人間とロボットの相互作用のシナリオにおいて、信頼と社会的受容という課題が生じています。
これには、おそらくタスク仕様の定義のロジックとして形式的な手法に基づいた、ロボットの認知機能の解釈可能な実装が必要です。
ただし、複雑で現実的なシナリオでは、事前の知識が利用できないことがよくあります。
この論文では、ノイズの多い例からの帰納的論理プログラミングに基づくオフライン アルゴリズムを提案し、少数の異種の (つまり、反復的ではない) ロボット実行の生データからタスク仕様 (つまり、アクションの前提条件、制約、および効果) を直接抽出します。
私たちのアルゴリズムは、ビデオ運動学的記録からの教師なしアクション識別アルゴリズムの出力を利用します。
それを、私たちの方法論の解釈可能性に貢献する、環境に関する非常に基本的でほぼタスクに依存しない常識的な概念の定義と組み合わせることで、アクションの前提条件をエンコードする論理公理と、イベント計算におけるそれらの影響を学ぶことができます。
パラダイム。
学習された仕様の品質は主にアクション識別アルゴリズムの精度に依存するため、安全な実行を保証する、ユーザーのフィードバックからタスクの知識を段階的に改良するためのオンライン フレームワークも提案します。
安全性が重要な外科用ロボットシナリオにおけるユーザートレーニングのための標準的な操作タスクとベンチマークの結果は、より複雑な領域での拡張性に向けて有望な結果を伴う、私たちの方法論の堅牢性、データ効率、時間効率を示しています。

要約(オリジナル)

The increasing level of autonomy of robots poses challenges of trust and social acceptance, especially in human-robot interaction scenarios. This requires an interpretable implementation of robotic cognitive capabilities, possibly based on formal methods as logics for the definition of task specifications. However, prior knowledge is often unavailable in complex realistic scenarios. In this paper, we propose an offline algorithm based on inductive logic programming from noisy examples to extract task specifications (i.e., action preconditions, constraints and effects) directly from raw data of few heterogeneous (i.e., not repetitive) robotic executions. Our algorithm leverages on the output of any unsupervised action identification algorithm from video-kinematic recordings. Combining it with the definition of very basic, almost task-agnostic, commonsense concepts about the environment, which contribute to the interpretability of our methodology, we are able to learn logical axioms encoding preconditions of actions, as well as their effects in the event calculus paradigm. Since the quality of learned specifications depends mainly on the accuracy of the action identification algorithm, we also propose an online framework for incremental refinement of task knowledge from user feedback, guaranteeing safe execution. Results in a standard manipulation task and benchmark for user training in the safety-critical surgical robotic scenario, show the robustness, data- and time-efficiency of our methodology, with promising results towards the scalability in more complex domains.

arxiv情報

著者 Daniele Meli,Paolo Fiorini
発行日 2025-01-13 17:25:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LO, cs.RO パーマリンク