要約
3D モデルと 2D-3D アライメント アノテーションを提供するオリジナルの MS-COCO データセットの拡張である 3D-COCO を紹介します。
3D-COCO は、テキスト、2D 画像、および 3D CAD モデルのクエリで構成可能な 3D 再構成や画像検出などのコンピューター ビジョン タスクを実現するように設計されました。
ShapeNet と Objaverse で収集された 28,000 の 3D モデルを使用して、既存の MS-COCO データセットを完成させます。
IoU ベースの方法を使用して、各 MS-COCO アノテーションを最適な 3D モデルと照合し、2D と 3D の位置合わせを提供します。
3D-COCO のオープンソースの性質は、3D 関連のトピックに関する新しい研究への道を開く初の機能です。
データセットとそのソース コードは、https://kalisteo.cea.fr/index.php/coco3d-object-detection-and-reconstruction/ で入手できます。
要約(オリジナル)
We introduce 3D-COCO, an extension of the original MS-COCO dataset providing 3D models and 2D-3D alignment annotations. 3D-COCO was designed to achieve computer vision tasks such as 3D reconstruction or image detection configurable with textual, 2D image, and 3D CAD model queries. We complete the existing MS-COCO dataset with 28K 3D models collected on ShapeNet and Objaverse. By using an IoU-based method, we match each MS-COCO annotation with the best 3D models to provide a 2D-3D alignment. The open-source nature of 3D-COCO is a premiere that should pave the way for new research on 3D-related topics. The dataset and its source codes is available at https://kalisteo.cea.fr/index.php/coco3d-object-detection-and-reconstruction/
arxiv情報
著者 | Maxence Bideaux,Alice Phe,Mohamed Chaouch,Bertrand Luvison,Quoc-Cuong Pham |
発行日 | 2024-07-16 16:14:45+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google