要約
3D認識タスクでのデータ収集と注釈に必要な努力により、既存のデータを混合することにより多様なトレーニングサンプルを生成するために、サンプルデータ増強(MSDA)が混合されています。
最近、ポイントクラウド用に多くのMSDA技術が開発されましたが、主にLidarデータをターゲットにしており、Radar Point Cloudsへのアプリケーションをほとんど未開拓にしています。
この論文では、既存のMSDAメソッドをレーダーポイントクラウドに適用する可能性を検証し、これらの手法の適応におけるいくつかの課題を特定します。
これらの障害物は、レーダーの不規則な角度分布、マルチレーダーセットアップの単一センサー極レイアウトからの逸脱、およびポイントスパースに由来しています。
これらの問題に対処するために、クラスラベルに導かれた3Dポイントクラウドの柱レベルで混合物を適用する新しいMSDAアプローチであるクラスアウェアPillarmix(Capmix)を提案します。
サンプル全体に単一のミックス比に依存する方法とは異なり、Capmixは各柱に独立した比率を割り当て、サンプルの多様性を高めます。
さまざまなクラスの密度を考慮するために、クラス固有の分布を使用します。密なオブジェクト(大型車両など)の場合、別のサンプルからポイントを支持する比率を歪めますが、スパースオブジェクト(例:歩行者)の場合、元のポイントをサンプリングします。
このクラスが認識しているミキシングは、重要な詳細を保持し、各サンプルを新しい情報で充実させ、最終的にはより多様なトレーニングデータを生成します。
実験結果は、この方法がパフォーマンスを大幅に向上させるだけでなく、2つのデータセット(Bosch StreetとK-Radar)で既存のMSDAアプローチを上回ることを示しています。
この簡単でありながら効果的なアプローチが、レーダーデータのMSDA技術のさらなる調査を引き起こすと考えています。
要約(オリジナル)
Due to the significant effort required for data collection and annotation in 3D perception tasks, mixed sample data augmentation (MSDA) has been widely studied to generate diverse training samples by mixing existing data. Recently, many MSDA techniques have been developed for point clouds, but they mainly target LiDAR data, leaving their application to radar point clouds largely unexplored. In this paper, we examine the feasibility of applying existing MSDA methods to radar point clouds and identify several challenges in adapting these techniques. These obstacles stem from the radar’s irregular angular distribution, deviations from a single-sensor polar layout in multi-radar setups, and point sparsity. To address these issues, we propose Class-Aware PillarMix (CAPMix), a novel MSDA approach that applies MixUp at the pillar level in 3D point clouds, guided by class labels. Unlike methods that rely a single mix ratio to the entire sample, CAPMix assigns an independent ratio to each pillar, boosting sample diversity. To account for the density of different classes, we use class-specific distributions: for dense objects (e.g., large vehicles), we skew ratios to favor points from another sample, while for sparse objects (e.g., pedestrians), we sample more points from the original. This class-aware mixing retains critical details and enriches each sample with new information, ultimately generating more diverse training data. Experimental results demonstrate that our method not only significantly boosts performance but also outperforms existing MSDA approaches across two datasets (Bosch Street and K-Radar). We believe that this straightforward yet effective approach will spark further investigation into MSDA techniques for radar data.
arxiv情報
著者 | Miao Zhang,Sherif Abdulatif,Benedikt Loesch,Marco Altmann,Bin Yang |
発行日 | 2025-03-04 15:02:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google