RSPT: Reconstruct Surroundings and Predict Trajectories for Generalizable Active Object Tracking

要約

タイトル:RSPT: 一般化されたアクティブオブジェクトトラッキングのために周囲を再構築し、軌道を予測する

要約:

– Active Object Tracking (AOT)は、オブジェクトとトラッカーの特定の関係を維持することを目的とし、観測データに基づいてトラッカーの動きを自律的に制御する。AOTは、モバイルロボットや自動運転など幅広いアプリケーションに利用されている。
– しかし、異なるシナリオで堅牢に動作する汎用的なアクティブトラッカーを構築することは、特に複雑な障害物や多様なレイアウトが存在する非構造化環境では、依然として難しいとされている。
– この問題に対処するために、周囲のジオメトリ構造とターゲットのダイナミクスをモデル化できる状態表現を構築することが重要であると主張している。
– そこで、RSPTというフレームワークを提案し、周囲を再構築し、ターゲットの軌道を予測することによって、構造感覚を持った動きの表現を形成する。
– さらに、非対称なデュエリングメカニズムで訓練することによって、ポリシーネットワークの汎化を強化する。
– RSPTは、さまざまなシミュレーションシナリオで評価され、複雑な障害物やレイアウトが存在する未知の環境で既存の方法よりも優れた性能を発揮することが示されている。また、RSPTを実世界の環境に転送することも成功している。プロジェクトウェブサイト:https://sites.google.com/view/aot-rspt。

要約(オリジナル)

Active Object Tracking (AOT) aims to maintain a specific relation between the tracker and object(s) by autonomously controlling the motion system of a tracker given observations. AOT has wide-ranging applications, such as in mobile robots and autonomous driving. However, building a generalizable active tracker that works robustly across different scenarios remains a challenge, especially in unstructured environments with cluttered obstacles and diverse layouts. We argue that constructing a state representation capable of modeling the geometry structure of the surroundings and the dynamics of the target is crucial for achieving this goal. To address this challenge, we present RSPT, a framework that forms a structure-aware motion representation by Reconstructing the Surroundings and Predicting the target Trajectory. Additionally, we enhance the generalization of the policy network by training in an asymmetric dueling mechanism. We evaluate RSPT on various simulated scenarios and show that it outperforms existing methods in unseen environments, particularly those with complex obstacles and layouts. We also demonstrate the successful transfer of RSPT to real-world settings. Project Website: https://sites.google.com/view/aot-rspt.

arxiv情報

著者 Fangwei Zhong,Xiao Bi,Yudi Zhang,Wei Zhang,Yizhou Wang
発行日 2023-04-07 12:52:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CV, cs.RO パーマリンク