Explaining the Decisions of Deep Policy Networks for Robotic Manipulations

要約

深いポリシー ネットワークにより、ロボットは現実世界のさまざまな複雑なタスクをエンドツーエンド方式で解決するための動作を学習できるようになります。
しかし、行動の理由を示すには透明性が欠けています。
したがって、このようなブラックボックス モデルは、実際にロボットを展開する際に信頼性が低く、破壊的な動作を引き起こすことがよくあります。
透明性を高めるためには、各入力特徴が特定の動作の決定にどの程度寄与するかを考慮してロボットの動作を説明することが重要です。
この論文では、入力帰属手法による深いポリシー モデルの明示的な分析を提示し、各入力特徴がロボット ポリシー モデルの決定にどのように、どの程度影響するかを説明します。
この目的を達成するために、ロボット ポリシー ネットワークに入力帰属手法を適用するための 2 つの方法を提案します。(1) 各関節トルクの重要度係数を測定して、エンドエフェクターの動きに対するモーター トルクの影響を反映します。(2)
関連性伝播方法を変更して、深いポリシー ネットワークでの負の入力と出力を適切に処理します。
私たちの知る限り、これはロボット操作のためのオンラインの深層ポリシーネットワークにおけるマルチモーダルセンサー入力の入力属性の動的な変化を特定した最初のレポートです。

要約(オリジナル)

Deep policy networks enable robots to learn behaviors to solve various real-world complex tasks in an end-to-end fashion. However, they lack transparency to provide the reasons of actions. Thus, such a black-box model often results in low reliability and disruptive actions during the deployment of the robot in practice. To enhance its transparency, it is important to explain robot behaviors by considering the extent to which each input feature contributes to determining a given action. In this paper, we present an explicit analysis of deep policy models through input attribution methods to explain how and to what extent each input feature affects the decisions of the robot policy models. To this end, we present two methods for applying input attribution methods to robot policy networks: (1) we measure the importance factor of each joint torque to reflect the influence of the motor torque on the end-effector movement, and (2) we modify a relevance propagation method to handle negative inputs and outputs in deep policy networks properly. To the best of our knowledge, this is the first report to identify the dynamic changes of input attributions of multi-modal sensor inputs in deep policy networks online for robotic manipulation.

arxiv情報

著者 Seongun Kim,Jaesik Choi
発行日 2023-10-30 10:44:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク