Image Amodal Completion: A Survey

要約

既存のコンピュータビジョンは、物体の見える部分を理解することでは人間に匹敵するが、部分的に隠されている物体の見えない部分を表現することでは、まだ人間に大きく及ばない。画像アモーダル補完は、人間のようなアモーダル補完機能をコンピュータに搭載し、部分的に隠されているにもかかわらず、無傷の物体を理解することを目的としている。本調査の主な目的は、画像アモーダル補完の分野における研究ホットスポット、キーテクノロジー、および将来動向を直感的に理解することである。まず、この新しい分野における最新の文献を包括的にレビューし、アモーダル形状補完、アモーダル外観補完、順序知覚を含む画像アモーダル補完の3つの主要なタスクについて検討する。次に、画像アモーダル補完に関連する一般的なデータセットを、それらの一般的なデータ収集方法と評価指標と共に検討する。最後に、画像アモーダル補完の実世界への応用と今後の研究の方向性について議論し、読者が既存技術の課題と今後の研究動向を理解することを容易にする。

要約(オリジナル)

Existing computer vision systems can compete with humans in understanding the visible parts of objects, but still fall far short of humans when it comes to depicting the invisible parts of partially occluded objects. Image amodal completion aims to equip computers with human-like amodal completion functions to understand an intact object despite it being partially occluded. The main purpose of this survey is to provide an intuitive understanding of the research hotspots, key technologies and future trends in the field of image amodal completion. Firstly, we present a comprehensive review of the latest literature in this emerging field, exploring three key tasks in image amodal completion, including amodal shape completion, amodal appearance completion, and order perception. Then we examine popular datasets related to image amodal completion along with their common data collection methods and evaluation metrics. Finally, we discuss real-world applications and future research directions for image amodal completion, facilitating the reader’s understanding of the challenges of existing technologies and upcoming research trends.

arxiv情報

著者 Jiayang Ao,Krista A. Ehinger,Qiuhong Ke
発行日 2022-07-05 14:13:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.LG パーマリンク