要約
サービスロボットは私たちの日常生活にますます溶け込んでおり、さまざまな作業を手伝ってくれます。
このような環境では、ロボットは環境内で作業中に新しいオブジェクトに頻繁に直面するため、それらをオープンエンド形式で学習する必要があります。
さらに、そのようなロボットは幅広いオブジェクト カテゴリを認識できなければなりません。
この論文では、少数ショットの物体認識問題に対処するための、複数の表現に基づく生涯アンサンブル学習アプローチを紹介します。
特に、深い表現と手作りの 3D 形状記述子に基づいてアンサンブル手法を形成します。
生涯学習を促進するために、各アプローチにはオブジェクト情報を瞬時に保存および検索するためのメモリユニットが装備されています。
提案されたモデルは、3D オブジェクト カテゴリの数が固定されておらず、時間の経過とともに増加する可能性がある、オープンエンドの学習シナリオに適しています。
私たちは、オフラインおよびオープンエンドのシナリオで提案されたアプローチのパフォーマンスを評価するために、広範な一連の実験を実行しました。
評価の目的で、実際の物体データセットに加えて、90 個の物体の 27,000 ビューで構成される大規模な合成家庭用物体データセットを生成します。
実験結果は、オンラインの数ショット 3D オブジェクト認識タスクにおける提案された方法の有効性と、最先端のオープンエンド学習アプローチよりも優れたパフォーマンスを示しています。
さらに、私たちの結果は、アンサンブル学習はオフライン設定ではそれほど有益ではありませんが、生涯にわたる数回の学習状況では非常に有益であることを示しています。
さらに、シミュレーションと実際のロボット設定の両方でアプローチの有効性を実証しました。ロボットは限られた例から新しいカテゴリを迅速に学習しました。
要約(オリジナル)
Service robots are integrating more and more into our daily lives to help us with various tasks. In such environments, robots frequently face new objects while working in the environment and need to learn them in an open-ended fashion. Furthermore, such robots must be able to recognize a wide range of object categories. In this paper, we present a lifelong ensemble learning approach based on multiple representations to address the few-shot object recognition problem. In particular, we form ensemble methods based on deep representations and handcrafted 3D shape descriptors. To facilitate lifelong learning, each approach is equipped with a memory unit for storing and retrieving object information instantly. The proposed model is suitable for open-ended learning scenarios where the number of 3D object categories is not fixed and can grow over time. We have performed extensive sets of experiments to assess the performance of the proposed approach in offline, and open-ended scenarios. For the evaluation purpose, in addition to real object datasets, we generate a large synthetic household objects dataset consisting of 27000 views of 90 objects. Experimental results demonstrate the effectiveness of the proposed method on online few-shot 3D object recognition tasks, as well as its superior performance over the state-of-the-art open-ended learning approaches. Furthermore, our results show that while ensemble learning is modestly beneficial in offline settings, it is significantly beneficial in lifelong few-shot learning situations. Additionally, we demonstrated the effectiveness of our approach in both simulated and real-robot settings, where the robot rapidly learned new categories from limited examples.
arxiv情報
著者 | Hamidreza Kasaei,Songsong Xiong |
発行日 | 2024-01-09 13:21:21+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google