Development and Adaptation of Robotic Vision in the Real-World: the Challenge of Door Detection

要約

モバイル サービス ロボットは、人間中心の現実世界の領域でますます普及しており、制約のない屋内環境で自律的に動作します。
このような状況において、ロボットビジョンは、サービスロボットが視覚的な観察から高レベルの環境特徴を認識できるようにする上で中心的な役割を果たします。
ディープラーニングに基づくデータ駆動型のアプローチはビジョン システムの限界を押し広げていますが、これらの技術を現実世界のロボット シナリオに適用すると、独特の方法論上の課題が生じます。
従来のモデルは、サービス ロボットに特有の困難な認識制約を表すことができず、ロボットが最終的に動作する特定の環境に適応させる必要があります。
私たちは、ディープアーキテクチャのトレーニングに使用されるロボットの観点からビジュアルデータセットを合成するためのデータ品質と取得コストのバランスをとる、フォトリアリスティックなシミュレーションを活用する方法を提案します。
次に、ロボットが展開されるターゲット ドメインに対して一般的な検出器を適格にする利点を示し、そのような設定から新しい例を取得するための労力とパフォーマンスの向上との間のトレードオフも示します。
私たちの大規模な実験キャンペーンでは、動的な設定でマップのトポロジーを推測するのに役立つドア検出タスク (つまり、出入り口の存在と通過可能性の認識) に焦点を当てています。
私たちの発見は、現実世界のロボット展開で検証され、著名な深層学習モデルを比較し、実際の設定におけるアプローチの有効性を実証しています。

要約(オリジナル)

Mobile service robots are increasingly prevalent in human-centric, real-world domains, operating autonomously in unconstrained indoor environments. In such a context, robotic vision plays a central role in enabling service robots to perceive high-level environmental features from visual observations. Despite the data-driven approaches based on deep learning push the boundaries of vision systems, applying these techniques to real-world robotic scenarios presents unique methodological challenges. Traditional models fail to represent the challenging perception constraints typical of service robots and must be adapted for the specific environment where robots finally operate. We propose a method leveraging photorealistic simulations that balances data quality and acquisition costs for synthesizing visual datasets from the robot perspective used to train deep architectures. Then, we show the benefits in qualifying a general detector for the target domain in which the robot is deployed, showing also the trade-off between the effort for obtaining new examples from such a setting and the performance gain. In our extensive experimental campaign, we focus on the door detection task (namely recognizing the presence and the traversability of doorways) that, in dynamic settings, is useful to infer the topology of the map. Our findings are validated in a real-world robot deployment, comparing prominent deep-learning models and demonstrating the effectiveness of our approach in practical settings.

arxiv情報

著者 Michele Antonazzi,Matteo Luperto,N. Alberto Borghese,Nicola Basilico
発行日 2024-01-31 16:55:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク