PARSAC: Accelerating Robust Multi-Model Fitting with Parallel Sample Consensus

要約

ノイズの多いデータから幾何モデルの複数のインスタンスをロバストに推定するためのリアルタイム手法を提案します。
消失点、平面ホモグラフィー、または基本行列などの幾何学モデルは、3D シーン分析に不可欠です。
以前のアプローチでは、反復的な方法で個別のモデル インスタンスを検出するため、並列計算による高速化の可能性が制限されていました。
対照的に、私たちの方法では、すべてのモデル インスタンスを独立して並行して検出します。
ニューラル ネットワークは、サンプルとインライアの重みの複数のセットを予測することによって、入力データを潜在的なモデル インスタンスを表すクラスターにセグメント化します。
予測された重みを使用して、RANSAC のような方法で、各潜在的なインスタンスのモデル パラメーターを個別に決定します。
タスク固有の損失関数を介してニューラル ネットワークをトレーニングします。つまり、入力データのグラウンド トゥルース セグメンテーションは必要ありません。
ホモグラフィーと基本行列フィッティングに適したトレーニング データが不足しているため、さらに 2 つの新しい合成データセットを提示します。
これらおよび確立された複数のデータセットに対して、画像あたりわずか 5 ミリ秒の推論時間で最先端のパフォーマンスを実証します。

要約(オリジナル)

We present a real-time method for robust estimation of multiple instances of geometric models from noisy data. Geometric models such as vanishing points, planar homographies or fundamental matrices are essential for 3D scene analysis. Previous approaches discover distinct model instances in an iterative manner, thus limiting their potential for speedup via parallel computation. In contrast, our method detects all model instances independently and in parallel. A neural network segments the input data into clusters representing potential model instances by predicting multiple sets of sample and inlier weights. Using the predicted weights, we determine the model parameters for each potential instance separately in a RANSAC-like fashion. We train the neural network via task-specific loss functions, i.e. we do not require a ground-truth segmentation of the input data. As suitable training data for homography and fundamental matrix fitting is scarce, we additionally present two new synthetic datasets. We demonstrate state-of-the-art performance on these as well as multiple established datasets, with inference times as small as five milliseconds per image.

arxiv情報

著者 Florian Kluger,Bodo Rosenhahn
発行日 2024-01-26 14:54:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク