Learning Human-Aligned Representations with Contrastive Learning and Generative Similarity

要約

人間は効果的な表現に依存して、いくつかの例から学習し、感覚データから有用な情報を抽象化します。
機械学習モデルにそのような表現を誘導することは、少数のショット学習や堅牢性など、さまざまなベンチマークでのパフォーマンスを改善することが示されています。
ただし、人間の類似性の判断などの心理的に豊富なトレーニングデータがスケーリングに費用がかかるため、その目標を達成するための効果的なトレーニング手順を見つけることは挑戦的です。また、人間の帰納的バイアスのベイジアンモデルは、複雑で現実的なドメインには手に負えないことがよくあります。
ここでは、同じ分布からサンプリングされている可能性が高い場合、2つのデータポイントが同様と見なされる生成的類似性のベイジアン概念を活用することにより、この課題に対処します。
この尺度は、確率的プログラムを含む複雑な生成プロセスに適用できます。
生成的類似性を対照的な学習目標に組み込み、人間の認知表現を表現する埋め込みの学習を可能にします。
私たちは、形状の規則性、抽象的なユークリッドの幾何学的概念、および自然画像のセマンティック階層の人間のような表現をキャプチャするために使用できることを示すことにより、アプローチの有用性を実証します。

要約(オリジナル)

Humans rely on effective representations to learn from few examples and abstract useful information from sensory data. Inducing such representations in machine learning models has been shown to improve their performance on various benchmarks such as few-shot learning and robustness. However, finding effective training procedures to achieve that goal can be challenging as psychologically rich training data such as human similarity judgments are expensive to scale, and Bayesian models of human inductive biases are often intractable for complex, realistic domains. Here, we address this challenge by leveraging a Bayesian notion of generative similarity whereby two data points are considered similar if they are likely to have been sampled from the same distribution. This measure can be applied to complex generative processes, including probabilistic programs. We incorporate generative similarity into a contrastive learning objective to enable learning of embeddings that express human cognitive representations. We demonstrate the utility of our approach by showing that it can be used to capture human-like representations of shape regularity, abstract Euclidean geometric concepts, and semantic hierarchies for natural images.

arxiv情報

著者 Raja Marjieh,Sreejan Kumar,Declan Campbell,Liyi Zhang,Gianluca Bencomo,Jake Snell,Thomas L. Griffiths
発行日 2025-01-31 16:19:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, q-bio.NC パーマリンク