1物体あたり数枚の画像を用いた物体認識のためのデータセットFew-Shot Object Learning (FewSOL) を紹介する。我々は336個の実世界の物体を、物体あたり9枚のRGB-D画像で、異なる視点から撮影した。オブジェクトのセグメンテーションマスク、オブジェクトのポーズ、オブジェクトの属性が提供される。さらに、330個の3Dオブジェクトモデルを用いて生成した合成画像を用いて、データセットを拡張した。我々は、我々のデータセットを用いて、(i)少数ショットオブジェクト分類、(ii)少数ショット学習とメタ学習のための最先端の手法によるジョイントオブジェクト分割と少数ショット分類を調査した。評価結果から、ロボット環境における少数ショット物体分類には、まだ改善すべき大きな余地があることがわかった。本データセットは、分類、検出、セグメンテーション、形状再構成、姿勢推定、キーポイント対応、属性認識など、一連の少数ショット物体認識問題の研究に利用することができる。データセットとコードは、https://irvlutd.github.io/FewSOL で公開されています。
We introduce the Few-Shot Object Learning (FewSOL) dataset for object recognition with a few images per object. We captured 336 real-world objects with 9 RGB-D images per object from different views. Object segmentation masks, object poses and object attributes are provided. In addition, synthetic images generated using 330 3D object models are used to augment the dataset. We investigated (i) few-shot object classification and (ii) joint object segmentation and few-shot classification with the state-of-the-art methods for few-shot learning and meta-learning using our dataset. The evaluation results show that there is still a large margin to be improved for few-shot object classification in robotic environments. Our dataset can be used to study a set of few-shot object recognition problems such as classification, detection and segmentation, shape reconstruction, pose estimation, keypoint correspondences and attribute recognition. The dataset and code are available at https://irvlutd.github.io/FewSOL.
著者 | Jishnu Jaykumar P,Yu-Wei Chao,Yu Xiang |
発行日 | 2022-11-08 16:55:14+00:00 |
arxivサイト | arxiv_id(pdf) |