L-VITeX: Light-weight Visual Intuition for Terrain Exploration

要約

この論文では、リソースに制約のあるロボットや群れ向けに設計された地形探索用の軽量視覚直観システムである L-VITeX について紹介します。
L-VITeX は、計算コストのかかる処理を行わずに、関心領域 (RoI) のヒントを提供することを目的としています。
Faster Objects, More Objects (FOMO) tinyML アーキテクチャを利用することで、システムは最小限のハードウェア リソース (ピーク時の RAM 使用量 < 50 KB) で動作しながら、ほぼリアルタイムの推論 (<200 KB) で RoI 検出の高精度 (>99%) を達成します。
MS)。
この論文では、山岳地帯、海中の難破船の残骸地域、火星の岩の表面など、さまざまな地形における L-VITeX のパフォーマンスを評価しています。
さらに、ESP32-Cam と Gaussian Splats (GS) によって実行される小型移動ロボットを使用した 3D マッピングにおけるシステムのアプリケーションを実証し、探査効率と意思決定を向上させる可能性を示しています。

要約(オリジナル)

This paper presents L-VITeX, a lightweight visual intuition system for terrain exploration designed for resource-constrained robots and swarms. L-VITeX aims to provide a hint of Regions of Interest (RoIs) without computationally expensive processing. By utilizing the Faster Objects, More Objects (FOMO) tinyML architecture, the system achieves high accuracy (>99%) in RoI detection while operating on minimal hardware resources (Peak RAM usage < 50 KB) with near real-time inference (<200 ms). The paper evaluates L-VITeX's performance across various terrains, including mountainous areas, underwater shipwreck debris regions, and Martian rocky surfaces. Additionally, it demonstrates the system's application in 3D mapping using a small mobile robot run by ESP32-Cam and Gaussian Splats (GS), showcasing its potential to enhance exploration efficiency and decision-making.

arxiv情報

著者 Antar Mazumder,Zarin Anjum Madhiha
発行日 2024-10-10 12:46:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク