要約
一般化トレーニングデータの範囲外では、異なるデータソース間で転送される効果とそうでない効果に関する事前知識を活用する必要があります。
転送学習は、ソース(トレーニング)およびターゲット(予測)データのセットに関するこの知識を指定および改善するためのフレームワークです。
挑戦的なオープンな問題は、負の伝達の経験的現象に対処することです。これにより、転送学習者は、ソースデータを以前よりも考慮した後、ターゲットデータでより悪化します。
最初に、負の伝達に関するベイジアンの視点を紹介し、次にそれに対処する方法を紹介します。
私たちの定式化からの重要な洞察は、負の伝達が、ソースデータの譲渡不可能な原因に関する誤った特定の事前の情報に起因する可能性があることです。
提案された方法、確率的転送学習のためのプロキシ情報に基づいた堅牢な方法(プロンプト)は、ソースデータの事前知識を必要としません(データソースは「不明」かもしれません)。
したがって、潜在的な交絡因子の存在など、タスク間の違いが観察されない場合、プロンプトは適用されます。
さらに、学習者は、ターゲットタスクの観測にアクセスする必要はなく(「微調整することはできません)、代わりにプロキシ(間接)情報を使用する必要があります。
我々の理論的結果は、否定的な伝達の脅威はプロキシ情報の情報性に依存しないことを示しており、人間のフィードバックなどの騒々しい間接情報のみが利用可能な場合のプロンプトの有用性を強調しています。
要約(オリジナル)
Generalization outside the scope of one’s training data requires leveraging prior knowledge about the effects that transfer, and the effects that don’t, between different data sources. Transfer learning is a framework for specifying and refining this knowledge about sets of source (training) and target (prediction) data. A challenging open problem is addressing the empirical phenomenon of negative transfer, whereby the transfer learner performs worse on the target data after taking the source data into account than before. We first introduce a Bayesian perspective on negative transfer, and then a method to address it. The key insight from our formulation is that negative transfer can stem from misspecified prior information about non-transferable causes of the source data. Our proposed method, proxy-informed robust method for probabilistic transfer learning (PROMPT), does not require prior knowledge of the source data (the data sources may be ‘unknown’). PROMPT is thus applicable when differences between tasks are unobserved, such as in the presence of latent confounders. Moreover, the learner need not have access to observations in the target task (cannot ‘fine-tune’), and instead makes use of proxy (indirect) information. Our theoretical results show that the threat of negative transfer does not depend on the informativeness of the proxy information, highlighting the usefulness of PROMPT in cases where only noisy indirect information, such as human feedback, is available.
arxiv情報
著者 | Sabina J. Sloman,Julien Martinelli,Samuel Kaski |
発行日 | 2025-02-13 16:28:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google