SVNet: Where SO(3) Equivariance Meets Binarization on Point Cloud Representation

要約

自動運転やロボティクスなど、リアルタイムで信頼性の高い応答が求められることが多いシナリオでエッジ デバイスが広く使用されているため、3D 点群のアプリケーションには効率と堅牢性がますます必要とされています。
この論文では、SO(3) 等分散とネットワーク 2 値化を使用して 3D 学習アーキテクチャを構築するための一般的なフレームワークを設計することにより、この課題に取り組んでいます。
ただし、同変ネットワークと二値化の素朴な組み合わせは、最適ではない計算効率または幾何学的なあいまいさのいずれかを引き起こします。
両方のケースを回避するために、ネットワーク内にスカラー機能とベクター機能の両方を配置することを提案します。
正確には、スカラー機能の存在により、ネットワークの大部分が二値化可能になりますが、ベクター機能は豊富な構造情報を保持し、SO(3) の等分散性を保証します。
提案されたアプローチは、PointNet や DGCNN などの一般的なバックボーンに適用できます。
一方、ModelNet40、ShapeNet、および実世界のデータセット ScanObjectNN での実験では、この方法が効率、回転の堅牢性、および精度の間で大きなトレードオフを達成することが実証されました。
コードは https://github.com/zhuoinoulu/svnet で入手できます。

要約(オリジナル)

Efficiency and robustness are increasingly needed for applications on 3D point clouds, with the ubiquitous use of edge devices in scenarios like autonomous driving and robotics, which often demand real-time and reliable responses. The paper tackles the challenge by designing a general framework to construct 3D learning architectures with SO(3) equivariance and network binarization. However, a naive combination of equivariant networks and binarization either causes sub-optimal computational efficiency or geometric ambiguity. We propose to locate both scalar and vector features in our networks to avoid both cases. Precisely, the presence of scalar features makes the major part of the network binarizable, while vector features serve to retain rich structural information and ensure SO(3) equivariance. The proposed approach can be applied to general backbones like PointNet and DGCNN. Meanwhile, experiments on ModelNet40, ShapeNet, and the real-world dataset ScanObjectNN, demonstrated that the method achieves a great trade-off between efficiency, rotation robustness, and accuracy. The codes are available at https://github.com/zhuoinoulu/svnet.

arxiv情報

著者 Zhuo Su,Max Welling,Matti pietikäinen,Li Liu
発行日 2022-09-13 12:12:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク