EPContrast: Effective Point-level Contrastive Learning for Large-scale Point Cloud Understanding

要約

点レベルの対比学習による帰納的バイアスの獲得は、点群の事前トレーニングにおいて最も重要な意味を持ちます。
ただし、点群の規模に応じて計算要件が二乗増加するため、実際の展開と実行には大きな障害が生じます。
この課題に対処するために、この論文では、AGContrast と ChannelContrast で構成される \textbf{EPContrast} と呼ばれる、大規模な点群を理解するための効果的な点レベルの対照学習方法を提案します。
実際には、AGContrast は非対称粒度埋め込みに基づいて正と負のペアを構築しますが、ChannelContrast はチャネル特徴マップ間に対照的な監視を課します。
EPContrast は、計算リソースの負担を軽減しながら、ポイントレベルのコントラスト損失を提供します。
EPContrast の有効性は、セマンティック セグメンテーション、インスタンス セグメンテーション、オブジェクト検出などのタスクを含む、S3DIS および ScanNetV2 の包括的な検証を通じて実証されています。
さらに、豊富なアブレーション実験により、ラベル効率の高いワンエポックトレーニング設定下での顕著なバイアス誘導能力が実証されています。

要約(オリジナル)

The acquisition of inductive bias through point-level contrastive learning holds paramount significance in point cloud pre-training. However, the square growth in computational requirements with the scale of the point cloud poses a substantial impediment to the practical deployment and execution. To address this challenge, this paper proposes an Effective Point-level Contrastive Learning method for large-scale point cloud understanding dubbed \textbf{EPContrast}, which consists of AGContrast and ChannelContrast. In practice, AGContrast constructs positive and negative pairs based on asymmetric granularity embedding, while ChannelContrast imposes contrastive supervision between channel feature maps. EPContrast offers point-level contrastive loss while concurrently mitigating the computational resource burden. The efficacy of EPContrast is substantiated through comprehensive validation on S3DIS and ScanNetV2, encompassing tasks such as semantic segmentation, instance segmentation, and object detection. In addition, rich ablation experiments demonstrate remarkable bias induction capabilities under label-efficient and one-epoch training settings.

arxiv情報

著者 Zhiyi Pan,Guoqing Liu,Wei Gao,Thomas H. Li
発行日 2024-10-22 17:27:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク