PixRO: Pixel-Distributed Rotational Odometry with Gaussian Belief Propagation

要約

視覚センサーは、高品質の画像をキャプチャする能力が向上しているだけでなく、独自のオンチップでデータを処理する能力も着実に向上しています。
しかし、VO パイプラインの大部分は、集中ユニット (CPU や GPU など) での完全な画像の送信と処理に依存しており、多くの場合、タスクに必要な冗長で低品質の情報が含まれています。
この論文では、フレーム間の回転推定のタスクに取り組みますが、完全な画像を使用してフレーム間の相対的な動きについて推論する代わりに、推定をピクセル レベルで分散します。
このパラダイムでは、各ピクセルは、ローカル情報と隣接ピクセルとのローカル メッセージ パッシングのみに依存して、グローバル モーションの推定値を生成します。
結果として得られるピクセルごとの推定値は、下流のタスクに伝達され、元の生のピクセル読み取り値の代わりに、より高レベルの有益な手がかりが得られます。
私たちは提案されたアプローチを実際の公開データセットで評価し、この新しい手法に関する詳細な洞察を提供し、コミュニティの将来の利益のために実装をオープンソース化します。

要約(オリジナル)

Visual sensors are not only becoming better at capturing high-quality images but also they have steadily increased their capabilities in processing data on their own on-chip. Yet the majority of VO pipelines rely on the transmission and processing of full images in a centralized unit (e.g. CPU or GPU), which often contain much redundant and low-quality information for the task. In this paper, we address the task of frame-to-frame rotational estimation but, instead of reasoning about relative motion between frames using the full images, distribute the estimation at pixel-level. In this paradigm, each pixel produces an estimate of the global motion by only relying on local information and local message-passing with neighbouring pixels. The resulting per-pixel estimates can then be communicated to downstream tasks, yielding higher-level, informative cues instead of the original raw pixel-readings. We evaluate the proposed approach on real public datasets, where we offer detailed insights about this novel technique and open-source our implementation for the future benefit of the community.

arxiv情報

著者 Ignacio Alzugaray,Riku Murai,Andrew Davison
発行日 2024-06-14 05:28:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.DC, cs.MA, cs.RO, eess.IV パーマリンク