要約
(1) 消失点の検出、(2) 3D 並進対称性の仮説、(3) 画像内の RP インスタンスの数のカウントの観点から、3D シーンの空間的理解のために単一の画像から繰り返しパターンを発見することの有用性を示します。
さらに、RP 発見出力を活用して、シーンのより正確で定量的なテキスト記述を形成する可能性を示します。
多様なバリエーションを持つ新しい 1K+ Recurring Pattern (RP) ベンチマークでの定量的評価は、単一のビューからの再発の視覚的認識が、既存の教師あり方法および/または数百万を使用する教師なし方法と同等またはそれ以上のシーン理解結果につながることを示しています。
画像の。
要約(オリジナル)
We demonstrate the utility of recurring pattern discovery from a single image for spatial understanding of a 3D scene in terms of (1) vanishing point detection, (2) hypothesizing 3D translation symmetry and (3) counting the number of RP instances in the image. Furthermore, we illustrate the feasibility of leveraging RP discovery output to form a more precise, quantitative text description of the scene. Our quantitative evaluations on a new 1K+ Recurring Pattern (RP) benchmark with diverse variations show that visual perception of recurrence from one single view leads to scene understanding outcomes that are as good as or better than existing supervised methods and/or unsupervised methods that use millions of images.
arxiv情報
著者 | Shimian Zhang,Skanda Bharadwaj,Keaton Kraiger,Yashasvi Asthana,Hong Zhang,Robert Collins,Yanxi Liu |
発行日 | 2022-10-14 17:45:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google