要約
この論文では、点群の新しい歪み定量化方法であるマルチスケールポテンシャルエネルギー不一致(MPED)を提案します。
現在、さまざまな点群認識タスクの効果的な歪みの定量化が不足しています。
具体的には、高密度の点群の場合、歪みの定量化方法を使用して、人間の主観的なスコアを予測し、圧縮や強調などの人間の知覚タスク パラメーターの選択を最適化します。
まばらな点群の場合、歪みの定量化方法は損失関数として機能し、教師なし学習タスク (点群の再構成、補完、アップサンプリングなど) のディープ ニューラル ネットワークのトレーニングをガイドします。
したがって、効果的な歪みの定量化は、微分可能で、歪みが識別可能であり、計算の複雑さが低くなければなりません。
ただし、現在の歪みの定量化では、3 つの条件すべてを満たすことはできません。
このギャップを埋めるために、古典物理学に触発された新しいポイント クラウド機能記述方法、点ポテンシャル エネルギー (PPE) を提案します。
点群はポテンシャル エネルギーを持つシステムであり、歪みによって総ポテンシャル エネルギーが変化する可能性があると考えています。
さまざまな近隣サイズで評価することにより、提案された MPED はグローバルとローカルのトレードオフを達成し、マルチスケールで歪みを捉えます。
さらに、古典的な面取り距離が MPED の特殊なケースであることを理論的に示します。
広範な実験により、提案された MPED は、人間と機械の両方の知覚タスクで現在の方法よりも優れていることが示されています。
コードは https://github.com/Qi-Yangsjtu/MPED で入手できます。
要約(オリジナル)
In this paper, we propose a new distortion quantification method for point clouds, the multiscale potential energy discrepancy (MPED). Currently, there is a lack of effective distortion quantification for a variety of point cloud perception tasks. Specifically, for dense point clouds, a distortion quantification method is used to predict human subjective scores and optimize the selection of human perception tasks parameters, such as compression and enhancement. For sparse point clouds, a distortion quantification methods is work as a loss function to guide the training of deep neural networks for unsupervised learning tasks (e.g., point cloud reconstruction, completion and upsampling). Therefore, an effective distortion quantification should be differentiable, distortion discriminable and have a low computational complexity. However, current distortion quantification cannot satisfy all three conditions. To fill this gap, we propose a new point cloud feature description method, the point potential energy (PPE), inspired by the classical physics. We regard the point clouds are systems that have potential energy and the distortion can change the total potential energy. By evaluating at various neighborhood sizes, the proposed MPED achieves global-local tradeoffs, capturing distortion in a multiscale fashion. We further theoretically show that classical Chamfer distance is a special case of our MPED. Extensive experiments show the proposed MPED superior to current methods on both human and machine perception tasks. Our code is avaliable at https://github.com/Qi-Yangsjtu/MPED.
arxiv情報
著者 | Qi Yang,Yujie Zhang,Siheng Chen,Yiling Xu,Jun Sun,Zhan Ma |
発行日 | 2022-10-11 15:38:08+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google