要約
Next Best View 計算 (NBV) は、ロボット工学における長年の問題であり、3D オブジェクトまたはシーンを効率的かつ正確に再構築するために、次に有益なセンサー位置を特定することにあります。
現在のほとんどの方法と同様に、深度センサーからの NBV 予測を検討します。
シーンのボリューム表現に依存する学習ベースの方法は、経路計画に適していますが、シーンのサイズにうまく対応できず、サーフェスベースの表現を使用する方法よりも精度が低くなります。
ただし、後者はカメラを少数のポーズに制限します。
両方の表現の利点を得るために、体積表現に対するモンテカルロ積分によって表面メトリックを最大化できることを示します。
私たちの方法は、大きなシーンにスケーリングし、自由なカメラの動きを処理します。Lidar システムのような深度センサーによって収集された任意の大きなポイント クラウドとカメラのポーズを入力として取り、NBV を予測します。
大規模で複雑な 3D シーンで構成される新しいデータセットに対するアプローチを示します。
要約(オリジナル)
Next Best View computation (NBV) is a long-standing problem in robotics, and consists in identifying the next most informative sensor position(s) for reconstructing a 3D object or scene efficiently and accurately. Like most current methods, we consider NBV prediction from a depth sensor. Learning-based methods relying on a volumetric representation of the scene are suitable for path planning, but do not scale well with the size of the scene and have lower accuracy than methods using a surface-based representation. However, the latter constrain the camera to a small number of poses. To obtain the advantages of both representations, we show that we can maximize surface metrics by Monte Carlo integration over a volumetric representation. Our method scales to large scenes and handles free camera motion: It takes as input an arbitrarily large point cloud gathered by a depth sensor like Lidar systems as well as camera poses to predict NBV. We demonstrate our approach on a novel dataset made of large and complex 3D scenes.
arxiv情報
著者 | Antoine Guédon,Pascal Monasse,Vincent Lepetit |
発行日 | 2022-08-22 17:04:14+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google