Loss Distillation via Gradient Matching for Point Cloud Completion with Weighted Chamfer Distance

要約

3D 点群により、環境の幾何学的情報を認識するロボットの能力が強化され、把握ポーズの検出やシーンの理解など、多くの下流タスクが可能になりました。
ただし、これらのタスクのパフォーマンスはデータ入力の品質に大きく依存しており、不完全な場合は結果が悪くなったり失敗したりする可能性があります。
面取り距離 (CD) やそのバリアント (例: HyperCD ) など、深層学習ベースの点群補完用に設計された最近のトレーニング損失関数は、優れた勾配重み付けスキームがパフォーマンスを大幅に向上できることを示唆しています。
ただし、これらの CD ベースの損失関数には通常、データ関連のパラメーター調整が必要であり、大量のデータを扱うタスクでは時間がかかる可能性があります。
この問題に対処するために、パラメーター調整を必要としない加重トレーニング損失のファミリー ({\em 加重 CD}) を見つけることを目指しています。
この目的のために、HyperCD と重み付き CD の間の逆伝播における学習動作を模倣することにより、適切な候補の損失関数を見つける検索スキーム {\em Loss Distillation via Gradient Matching} を提案します。
これが完了したら、加重 CD 損失に基づいてバックボーン ネットワークをトレーニングするための新しいバイレベル最適化式を提案します。
(1) 適切な重み付け関数を使用すると、重み付け CD は常に HyperCD と同様のパフォーマンスを達成でき、(2) Landau 重み付け CD、つまり {\em Landau CD} は点群の完成に関して HyperCD を上回るパフォーマンスを発揮できることがわかります。
いくつかのベンチマーク データセットに関する新しい最先端の結果。
{\it 私たちのデモ コードは \url{https://github.com/Zhang-VISLab/IROS2024-LossDistillationWeightedCD} で入手できます。}

要約(オリジナル)

3D point clouds enhanced the robot’s ability to perceive the geometrical information of the environments, making it possible for many downstream tasks such as grasp pose detection and scene understanding. The performance of these tasks, though, heavily relies on the quality of data input, as incomplete can lead to poor results and failure cases. Recent training loss functions designed for deep learning-based point cloud completion, such as Chamfer distance (CD) and its variants (\eg HyperCD ), imply a good gradient weighting scheme can significantly boost performance. However, these CD-based loss functions usually require data-related parameter tuning, which can be time-consuming for data-extensive tasks. To address this issue, we aim to find a family of weighted training losses ({\em weighted CD}) that requires no parameter tuning. To this end, we propose a search scheme, {\em Loss Distillation via Gradient Matching}, to find good candidate loss functions by mimicking the learning behavior in backpropagation between HyperCD and weighted CD. Once this is done, we propose a novel bilevel optimization formula to train the backbone network based on the weighted CD loss. We observe that: (1) with proper weighted functions, the weighted CD can always achieve similar performance to HyperCD, and (2) the Landau weighted CD, namely {\em Landau CD}, can outperform HyperCD for point cloud completion and lead to new state-of-the-art results on several benchmark datasets. {\it Our demo code is available at \url{https://github.com/Zhang-VISLab/IROS2024-LossDistillationWeightedCD}.}

arxiv情報

著者 Fangzhou Lin,Haotian Liu,Haoying Zhou,Songlin Hou,Kazunori D Yamada,Gregory S. Fischer,Yanhua Li,Haichong K. Zhang,Ziming Zhang
発行日 2024-09-10 03:02:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, cs.RO パーマリンク