YoloTag: Vision-based Robust UAV Navigation with Fiducial Markers

要約

無人航空機 (UAV) は、基準マーカーを環境内の視覚的なランドマークとして利用することで、正確な地図を迅速に構築し、空間を安全かつ効率的に移動できるようになり、人間とのスムーズなコラボレーションと共存の可能性を解き放ちます。
既存の基準マーカー手法は手作りの特徴抽出に依存しているため、精度が犠牲になります。
一方で、マーカー検出用のディープ ラーニング パイプラインは、ナビゲーション アプリケーションにとって重要なリアルタイムのランタイム制約を満たしていません。
この研究では、リアルタイム基準マーカーベースの位置特定システム YoloTag \textemdash を提案します。
YoloTag は、軽量の YOLO v8 オブジェクト検出器を使用して、ナビゲーションに必要な実行時の制約を満たしながら、画像内の基準マーカーを正確に検出します。
検出されたマーカーは、UAV の状態を推定するために効率的なパースペクティブ n ポイント アルゴリズムによって使用されます。
ただし、この位置特定システムではノイズが発生し、軌道追跡が不安定になります。
ノイズを抑制するために、周波数領域分析を通じてノイズを効果的に除去する高次のバターワース フィルターを設計します。
屋内環境での実際のロボット実験を通じてアルゴリズムを評価し、いくつかの距離指標の観点から、この方法の軌道追跡パフォーマンスを他のアプローチと比較します。

要約(オリジナル)

By harnessing fiducial markers as visual landmarks in the environment, Unmanned Aerial Vehicles (UAVs) can rapidly build precise maps and navigate spaces safely and efficiently, unlocking their potential for fluent collaboration and coexistence with humans. Existing fiducial marker methods rely on handcrafted feature extraction, which sacrifices accuracy. On the other hand, deep learning pipelines for marker detection fail to meet real-time runtime constraints crucial for navigation applications. In this work, we propose YoloTag \textemdash a real-time fiducial marker-based localization system. YoloTag uses a lightweight YOLO v8 object detector to accurately detect fiducial markers in images while meeting the runtime constraints needed for navigation. The detected markers are then used by an efficient perspective-n-point algorithm to estimate UAV states. However, this localization system introduces noise, causing instability in trajectory tracking. To suppress noise, we design a higher-order Butterworth filter that effectively eliminates noise through frequency domain analysis. We evaluate our algorithm through real-robot experiments in an indoor environment, comparing the trajectory tracking performance of our method against other approaches in terms of several distance metrics.

arxiv情報

著者 Sourav Raxit,Simant Bahadur Singh,Abdullah Al Redwan Newaz
発行日 2024-09-03 23:42:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク