Learning to View: Decision Transformers for Active Object Detection

要約

能動的知覚とは、計画システムと知覚システムを組み合わせてロボットを動かし、環境に関するより多くの情報をロボットに提供する幅広い種類の技術を指します。
ほとんどのロボット システムでは、通常、知覚はモーション プランニングとは無関係です。
たとえば、従来の物体検出は受動的で、受信した画像に対してのみ動作します。
ただし、検出信号を消費し、ロボットを動かして結果の品質を最大化するビューを収集することを計画できるようにすれば、結果を改善するチャンスがあります。
この論文では、強化学習 (RL) 手法を使用してロボットを制御し、検出品質を最大化する画像を取得します。
具体的には、事前に収集されたエキスパート データセットを使用して最初にポリシーを最適化し、次に環境内でより良いソリューションを探索することで、学習したポリシーを改善するオンライン微調整を備えた意思決定トランスフォーマーを使用することを提案します。
屋内シナリオ シミュレータから収集された対話型データセットで、提案された方法のパフォーマンスを評価します。
実験結果は、私たちの方法がエキスパート ポリシーや純粋なオフライン RL メソッドを含むすべてのベースラインよりも優れていることを示しています。
また、報酬の分布と観測空間の徹底的な分析も提供します。

要約(オリジナル)

Active perception describes a broad class of techniques that couple planning and perception systems to move the robot in a way to give the robot more information about the environment. In most robotic systems, perception is typically independent of motion planning. For example, traditional object detection is passive: it operates only on the images it receives. However, we have a chance to improve the results if we allow planning to consume detection signals and move the robot to collect views that maximize the quality of the results. In this paper, we use reinforcement learning (RL) methods to control the robot in order to obtain images that maximize the detection quality. Specifically, we propose using a Decision Transformer with online fine-tuning, which first optimizes the policy with a pre-collected expert dataset and then improves the learned policy by exploring better solutions in the environment. We evaluate the performance of proposed method on an interactive dataset collected from an indoor scenario simulator. Experimental results demonstrate that our method outperforms all baselines, including expert policy and pure offline RL methods. We also provide exhaustive analyses of the reward distribution and observation space.

arxiv情報

著者 Wenhao Ding,Nathalie Majcherczyk,Mohit Deshpande,Xuewei Qi,Ding Zhao,Rajasimman Madhivanan,Arnie Sen
発行日 2023-01-23 17:00:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク