要約
航空自律性の進歩に対する大きな障壁の 1 つは、機械学習モデルをトレーニングするための大規模な航空データセットを収集することです。
ドローンの配備による現実世界のデータ収集にはコストと時間がかかるため、ドローン アプリケーションでのモデルのトレーニングに合成データを使用する傾向が高まっています。
しかし、広範な一般化を促進し、モデルを現実世界に移行するには、あらゆる種類にわたってモデルをトレーニングするためのシミュレーション環境の多様性を高め、トレーニング データを増強することが不可欠であることが証明されています。
現在の合成航空データ生成ツールには、データ拡張機能がないか、データ収集のためのさまざまな現実的なシミュレーション シーンを構成および生成するために手動のワークロードまたは実際のサンプルに大きく依存しています。
これらの依存関係により、データ生成ワークフローのスケーラビリティが制限されます。
したがって、合成データ生成における汎用性とスケーラビリティのバランスをとることが大きな課題となります。
これらのギャップに対処するために、航空自律性アプリケーションに合わせて調整されたスケーラブルな航空合成データ拡張 (ASDA) フレームワークを導入します。
ASDA は、シーンとデータの拡張を自動的に実行して、さまざまなトレーニング タスク用の多様な航空データセットを生成する 2 つのスクリプト可能なパイプラインで中央データ収集エンジンを拡張します。
ASDA は、統合されたパイプライン上に統合されたプロンプトベースのインターフェイスを提供し、柔軟な制御を実現することで、データ生成ワークフローの効率を向上させます。
当社のデータ拡張の手続き型生成アプローチはパフォーマンスが高く、さまざまなシミュレーション環境、トレーニング タスク、データ収集のニーズに適応できます。
さまざまなデータセットを自動的に生成する方法の有効性を実証し、下流のパフォーマンス最適化の可能性を示します。
要約(オリジナル)
One major barrier to advancing aerial autonomy has been collecting large-scale aerial datasets for training machine learning models. Due to costly and time-consuming real-world data collection through deploying drones, there has been an increasing shift towards using synthetic data for training models in drone applications. However, to increase widespread generalization and transferring models to real-world, increasing the diversity of simulation environments to train a model over all the varieties and augmenting the training data, has been proved to be essential. Current synthetic aerial data generation tools either lack data augmentation or rely heavily on manual workload or real samples for configuring and generating diverse realistic simulation scenes for data collection. These dependencies limit scalability of the data generation workflow. Accordingly, there is a major challenge in balancing generalizability and scalability in synthetic data generation. To address these gaps, we introduce a scalable Aerial Synthetic Data Augmentation (ASDA) framework tailored to aerial autonomy applications. ASDA extends a central data collection engine with two scriptable pipelines that automatically perform scene and data augmentations to generate diverse aerial datasets for different training tasks. ASDA improves data generation workflow efficiency by providing a unified prompt-based interface over integrated pipelines for flexible control. The procedural generative approach of our data augmentation is performant and adaptable to different simulation environments, training tasks and data collection needs. We demonstrate the effectiveness of our method in automatically generating diverse datasets and show its potential for downstream performance optimization.
arxiv情報
著者 | Mehrnaz Sabet,Praveen Palanisamy,Sakshi Mishra |
発行日 | 2023-05-26 00:30:58+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google