要約
既存のコンピュータ ビジョン システムは、オブジェクトの可視部分を理解するという点では人間と競合できますが、部分的に遮られたオブジェクトの不可視部分を描写することに関しては、依然として人間には遠く及びません。
画像アモーダル補完は、部分的に遮られているにもかかわらず、完全なオブジェクトを理解するために、人間のようなアモーダル補完機能をコンピュータに装備することを目的としています。
この調査の主な目的は、画像アモーダル補完の分野における研究ホットスポット、主要技術、および将来の傾向を直感的に理解できるようにすることです。
まず、この新興分野の最新文献の包括的なレビューを紹介し、アモーダル形状補完、アモーダル外観補完、および順序認識を含む、画像アモーダル補完における 3 つの主要なタスクを検討します。
次に、画像アモーダル補完に関連する一般的なデータセットを、その一般的なデータ収集方法と評価指標とともに調べます。
最後に、画像アモーダル完成のための実世界のアプリケーションと将来の研究の方向性について説明し、既存の技術の課題と今後の研究動向についての読者の理解を促進します。
要約(オリジナル)
Existing computer vision systems can compete with humans in understanding the visible parts of objects, but still fall far short of humans when it comes to depicting the invisible parts of partially occluded objects. Image amodal completion aims to equip computers with human-like amodal completion functions to understand an intact object despite it being partially occluded. The main purpose of this survey is to provide an intuitive understanding of the research hotspots, key technologies and future trends in the field of image amodal completion. Firstly, we present a comprehensive review of the latest literature in this emerging field, exploring three key tasks in image amodal completion, including amodal shape completion, amodal appearance completion, and order perception. Then we examine popular datasets related to image amodal completion along with their common data collection methods and evaluation metrics. Finally, we discuss real-world applications and future research directions for image amodal completion, facilitating the reader’s understanding of the challenges of existing technologies and upcoming research trends.
arxiv情報
著者 | Jiayang Ao,Qiuhong Ke,Krista A. Ehinger |
発行日 | 2023-11-07 16:33:33+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google