Bayesian Data Augmentation and Training for Perception DNN in Autonomous Aerial Vehicles

要約

学習ベースのソリューションにより、自律システムの驚異的な機能が可能になりました。
自動運転車は、航空機と地上の両方で、知覚を含むさまざまな統合タスクを DNN に依存しています。
教師あり学習ソリューションの有効性は、トレーニング データの品質によって決まります。
トレーニング データと動作条件の間に不一致があると、致命的なインシデントにつながる可能性のある障害が発生します。
ただし、想定される動作環境を広範囲にカバーして、コンテキスト依存の膨大なデータを収集することは、非常に困難です。
DNN の合成データ生成技術を使用すると、さまざまなシナリオを簡単に調査できます。
しかし、航空機用の合成データ生成ソリューションはまだ不足しています。
この研究では、高忠実度の車両ダイナミクスと統合されたフォトリアリスティックなシミュレーションを活用した、航空機の知覚トレーニングのためのデータ拡張フレームワークを紹介します。
安全な着陸は自律飛行タクシーの開発における重要な課題であるため、着陸操作がこの研究の焦点として選択されます。
さまざまなシナリオでの着陸シミュレーションを繰り返すことで、VTOL 型 UAV の着陸性能を評価し、貴重なデータを収集します。
着陸パフォーマンスは、再トレーニングを通じて DNN を最適化するための目的関数として使用されます。
DNN の再トレーニングの計算コストが高いことを考慮して、データ拡張パラメーター空間を体系的に探索して最高のパフォーマンスのモデルを再トレーニングするベイジアン最適化をフレームワークに組み込みました。
このフレームワークにより、さまざまな着陸シナリオにわたって一貫して効果的な、高性能のデータ拡張パラメータを特定することができました。
このデータ拡張フレームワークの機能を利用して、堅牢な知覚モデルを取得しました。
このモデルは、さまざまな照明や気象条件の下で、知覚に基づく着陸成功率を一貫して少なくとも 20% 向上させました。

要約(オリジナル)

Learning-based solutions have enabled incredible capabilities for autonomous systems. Autonomous vehicles, both aerial and ground, rely on DNN for various integral tasks, including perception. The efficacy of supervised learning solutions hinges on the quality of the training data. Discrepancies between training data and operating conditions result in faults that can lead to catastrophic incidents. However, collecting vast amounts of context-sensitive data, with broad coverage of possible operating environments, is prohibitively difficult. Synthetic data generation techniques for DNN allow for the easy exploration of diverse scenarios. However, synthetic data generation solutions for aerial vehicles are still lacking. This work presents a data augmentation framework for aerial vehicle’s perception training, leveraging photorealistic simulation integrated with high-fidelity vehicle dynamics. Safe landing is a crucial challenge in the development of autonomous air taxis, therefore, landing maneuver is chosen as the focus of this work. With repeated simulations of landing in varying scenarios we assess the landing performance of the VTOL type UAV and gather valuable data. The landing performance is used as the objective function to optimize the DNN through retraining. Given the high computational cost of DNN retraining, we incorporated Bayesian Optimization in our framework that systematically explores the data augmentation parameter space to retrain the best-performing models. The framework allowed us to identify high-performing data augmentation parameters that are consistently effective across different landing scenarios. Utilizing the capabilities of this data augmentation framework, we obtained a robust perception model. The model consistently improved the perception-based landing success rate by at least 20% under different lighting and weather conditions.

arxiv情報

著者 Ashik E Rasul,Humaira Tasnim,Hyung-Jin Yoon,Ayoosh Bansal,Duo Wang,Naira Hovakimyan,Lui Sha,Petros Voulgaris
発行日 2024-12-10 16:41:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, cs.RO, I.2.10 パーマリンク