D-VAT: End-to-End Visual Active Tracking for Micro Aerial Vehicles

要約

ビジュアルアクティブトラッキングは、人間の支援、災害復旧、監視などの用途で重要な役割を果たしているため、ロボット工学の研究テーマとして成長しています。
パッシブ追跡とは対照的に、アクティブ追跡アプローチでは、視覚機能と制御機能を組み合わせてターゲットを検出し、アクティブに追跡します。
この分野の研究のほとんどは地上ロボットに焦点を当てていますが、空中プラットフォームに関するほんのわずかな貢献は依然として、その適用性を制限する重要な設計制約を引き起こしています。
これらの制限を克服するために、この論文では、超小型航空機プラットフォームに合わせた深層強化学習に基づく新しいエンドツーエンドの視覚的アクティブ追跡手法である D-VAT を提案します。
D-VAT エージェントは、単眼カメラの測定値を直接処理することで、ターゲットを追跡するために必要な車両の推力と角速度のコマンドを計算します。
提案されたアプローチにより、正確で衝突のない追跡操作が可能になり、トレーニング中に遭遇したものとは大きく異なるシミュレートされた環境上でさまざまな最先端のベースラインを上回るパフォーマンスが得られることを示します。

要約(オリジナル)

Visual active tracking is a growing research topic in robotics due to its key role in applications such as human assistance, disaster recovery, and surveillance. In contrast to passive tracking, active tracking approaches combine vision and control capabilities to detect and actively track the target. Most of the work in this area focuses on ground robots, while the very few contributions on aerial platforms still pose important design constraints that limit their applicability. To overcome these limitations, in this paper we propose D-VAT, a novel end-to-end visual active tracking methodology based on deep reinforcement learning that is tailored to micro aerial vehicle platforms. The D-VAT agent computes the vehicle thrust and angular velocity commands needed to track the target by directly processing monocular camera measurements. We show that the proposed approach allows for precise and collision-free tracking operations, outperforming different state-of-the-art baselines on simulated environments which differ significantly from those encountered during training.

arxiv情報

著者 Alberto Dionigi,Simone Felicioni,Mirko Leomanni,Gabriele Costante
発行日 2023-08-31 17:21:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク