要約
この論文では、相互排他性バイアスを伴うローショット オブジェクト学習 (LSME) を紹介します。これは、乳児の単語学習中に一般的に観察される現象である相互排他性バイアスの最初の計算フレーミングです。
私たちは、ML コミュニティがこの困難な学習タスクに取り組むことを可能にする、新しいデータセット、包括的なベースライン、最先端の手法を提供します。
LSME の目標は、複数のオブジェクトを含むシーンの RGB イメージを分析し、これまで知られていなかったオブジェクト インスタンスを提供されたカテゴリ ラベルに正しく関連付けることです。
次に、この関連付けを使用してローショット学習を実行し、カテゴリの汎化をテストします。
私たちは LSME 問題のデータ生成パイプラインを提供し、その困難に寄与する要因を徹底的に分析します。
さらに、最先端の基礎モデルを含む複数のベースラインのパフォーマンスを評価します。
最後に、ローショットの精度の点で最先端のモデルを上回るベースラインのアプローチを紹介します。
要約(オリジナル)
This paper introduces Low-shot Object Learning with Mutual Exclusivity Bias (LSME), the first computational framing of mutual exclusivity bias, a phenomenon commonly observed in infants during word learning. We provide a novel dataset, comprehensive baselines, and a state-of-the-art method to enable the ML community to tackle this challenging learning task. The goal of LSME is to analyze an RGB image of a scene containing multiple objects and correctly associate a previously-unknown object instance with a provided category label. This association is then used to perform low-shot learning to test category generalization. We provide a data generation pipeline for the LSME problem and conduct a thorough analysis of the factors that contribute to its difficulty. Additionally, we evaluate the performance of multiple baselines, including state-of-the-art foundation models. Finally, we present a baseline approach that outperforms state-of-the-art models in terms of low-shot accuracy.
arxiv情報
著者 | Anh Thai,Ahmad Humayun,Stefan Stojanov,Zixuan Huang,Bikram Boote,James M. Rehg |
発行日 | 2023-12-06 14:54:10+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google