Evaluating the effect of data augmentation and BALD heuristics on distillation of Semantic-KITTI dataset

要約

アクティブ ラーニング (AL) は、自動運転データセットにおける LiDAR 認識タスクでは比較的未開拓のままです。
この研究では、データセット蒸留またはコアサブセット選択 (完全なデータセットとほぼ同等のパフォーマンスを持つサブセット) のタスクに適用されるベイジアン能動学習法を評価します。
また、ベイジアン AL ベースのデータセット蒸留内でのデータ拡張 (DA) の適用の効果も研究します。
完全な Semantic-KITTI データセットでこれらの実験を実行します。
同じデータセットの 1/4 についてのみ、既存の研究に研究を拡張します。
DA と BALD の追加は、ラベリング効率に悪影響を及ぼし、したがってデータセットを抽出する能力に悪影響を及ぼします。
機能的な AL フレームワークを設計する際の重要な問題を示し、最後に現実世界のアクティブ ラーニングにおける課題のレビューで締めくくります。

要約(オリジナル)

Active Learning (AL) has remained relatively unexplored for LiDAR perception tasks in autonomous driving datasets. In this study we evaluate Bayesian active learning methods applied to the task of dataset distillation or core subset selection (subset with near equivalent performance as full dataset). We also study the effect of application of data augmentation (DA) within Bayesian AL based dataset distillation. We perform these experiments on the full Semantic-KITTI dataset. We extend our study over our existing work only on 1/4th of the same dataset. Addition of DA and BALD have a negative impact over the labeling efficiency and thus the capacity to distill datasets. We demonstrate key issues in designing a functional AL framework and finally conclude with a review of challenges in real world active learning.

arxiv情報

著者 Anh Duong,Alexandre Almin,Léo Lemarié,B Ravi Kiran
発行日 2023-02-21 13:56:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク