要約
点群の分類には、隣接フィーチャの集約が不可欠です。
既存の作業では、クラウド内の各ポイントは必然的に複数の集約センターの近隣として選択される可能性があります。これは、すべてのセンターがポイント クラウド全体から近隣フィーチャを個別に収集するためです。
したがって、各ポイントは繰り返し計算に参加する必要があり、メモリ内に冗長な複製が生成され、集中的な計算コストとメモリ消費につながります。
一方、より高い精度を追求するために、以前の方法では、複雑なローカル アグリゲーターに依存して細かい幾何学的表現を抽出することが多く、分類パイプラインがさらに遅くなります。
これらの問題に対処するために、点群分類のための線形複雑さの新しいローカルアグリゲーターを提案し、APP と名付けました。
具体的には、ソース ポイントと集約センターの間でフィーチャを交換するためのアンカーとして補助コンテナーを導入します。
各ソース ポイントはそのフィーチャを 1 つの補助コンテナーのみにプッシュし、各中心点は 1 つの補助コンテナーのみからフィーチャをプルします。
これにより、各ソース ポイントの再計算の問題が回避されます。
曇り点の局所構造の学習を容易にするために、オンライン法線推定モジュールを使用して説明可能な幾何学的情報を提供し、APP モデリング機能を強化します。
私たちが構築したネットワークは、以前のすべてのベースラインよりも効率的であり、メモリの消費量を抑えながら明確なマージンを持っています.
合成データセットと実際のデータセットの両方での実験は、APP-Net が他のネットワークに匹敵する精度に達することを示しています。
1 つの GPU で 10 GB 未満のメモリで 1 秒あたり 10,000 を超えるサンプルを処理できます。
https://github.com/MCG-NJU/APP-Net でコードを公開します。
要約(オリジナル)
Aggregating neighbor features is essential for point cloud classification. In the existing work, each point in the cloud may inevitably be selected as the neighbors of multiple aggregation centers, as all centers will gather neighbor features from the whole point cloud independently. Thus each point has to participate in the calculation repeatedly and generates redundant duplicates in the memory, leading to intensive computation costs and memory consumption. Meanwhile, to pursue higher accuracy, previous methods often rely on a complex local aggregator to extract fine geometric representation, which further slows down the classification pipeline. To address these issues, we propose a new local aggregator of linear complexity for point cloud classification, coined as APP. Specifically, we introduce an auxiliary container as an anchor to exchange features between the source point and the aggregating center. Each source point pushes its feature to only one auxiliary container, and each center point pulls features from only one auxiliary container. This avoids the re-computation issue of each source point. To facilitate the learning of the local structure of cloud point, we use an online normal estimation module to provide the explainable geometric information to enhance our APP modeling capability. Our built network is more efficient than all the previous baselines with a clear margin while still consuming a lower memory. Experiments on both synthetic and real datasets demonstrate that APP-Net reaches comparable accuracies to other networks. It can process more than 10,000 samples per second with less than 10GB of memory on a single GPU. We will release the code in https://github.com/MCG-NJU/APP-Net.
arxiv情報
著者 | Tao Lu,Chunxu Liu,Youxin Chen,Gangshan Wu,Limin Wang |
発行日 | 2022-08-18 15:21:01+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google