要約
この論文では、UAVの視覚ベースのナビゲーション(非公開の航空機)の生成モデルの適用を調査する潜在的な拡散確率モデル(DDPMS)に基づいた新しい視覚サーボ(VS)アプローチを提示します。
古典的なメソッドと対は反対に、提案されたアプローチにより、ターゲットが最初に見えない場合でも、目的のターゲットビューに到達することができます。
これは、DDPMが計画に使用する潜在的な表現と、ターゲットに触れられない初期ビューを含む軌跡のデータセットの学習のおかげで可能です。
コンパクトな表現は、クロスモーダル変異オートエンコーダーを使用して生の画像から学習されます。
現在の画像を考えると、DDPMは潜在スペースの軌跡を生成し、ロボットプラットフォームを目的の視覚ターゲットに導きます。
このアプローチは、2つのジェネリックマルチローターUAV(四肢装置と六角動態)を使用してシミュレーションで検証されています。
結果は、最初のビューに見えなくても、視覚ターゲットに正常に到達できることを示しています。
要約(オリジナル)
In this paper, we present a novel visual servoing (VS) approach based on latent Denoising Diffusion Probabilistic Models (DDPMs), that explores the application of generative models for vision-based navigation of UAVs (Uncrewed Aerial Vehicles). Opposite to classical VS methods, the proposed approach allows reaching the desired target view, even when the target is initially not visible. This is possible thanks to the learning of a latent representation that the DDPM uses for planning and a dataset of trajectories encompassing target-invisible initial views. A compact representation is learned from raw images using a Cross-Modal Variational Autoencoder. Given the current image, the DDPM generates trajectories in the latent space driving the robotic platform to the desired visual target. The approach has been validated in simulation using two generic multi-rotor UAVs (a quadrotor and a hexarotor). The results show that we can successfully reach the visual target, even if not visible in the initial view.
arxiv情報
著者 | Bishoy Gerges,Barbara Bazzana,Nicolò Botteghi,Youssef Aboudorra,Antonio Franchi |
発行日 | 2025-02-19 14:39:06+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google