Background Prompting for Improved Object Depth


単一の画像からオブジェクトの深さを推定することは、多くのビジョン、ロボット工学、グラフィックス アプリケーションにとって貴重なタスクです。
小規模な合成オブジェクト データセットのみを使用して、バックグラウンド プロンプトを学習します。
さらに、背景プロンプトは合成画像と実際のオブジェクト画像の間のドメインギャップを最小限に抑え、単純な微調整よりも優れた sim2real 一般化につながります。
Estimating the depth of objects from a single image is a valuable task for many vision, robotics, and graphics applications. However, current methods often fail to produce accurate depth for objects in diverse scenes. In this work, we propose a simple yet effective Background Prompting strategy that adapts the input object image with a learned background. We learn the background prompts only using small-scale synthetic object datasets. To infer object depth on a real image, we place the segmented object into the learned background prompt and run off-the-shelf depth networks. Background Prompting helps the depth networks focus on the foreground object, as they are made invariant to background variations. Moreover, Background Prompting minimizes the domain gap between synthetic and real object images, leading to better sim2real generalization than simple finetuning. Results on multiple synthetic and real datasets demonstrate consistent improvements in real object depths for a variety of existing depth networks. Code and optimized background prompts can be found at:


著者 Manel Baradad,Yuanzhen Li,Forrester Cole,Michael Rubinstein,Antonio Torralba,William T. Freeman,Varun Jampani
発行日 2023-06-08 17:59:59+00:00
