要約
近年、限られたアノテーション付きインスタンスでラベルを予測することを学習する、少数ショット学習とゼロショット学習が大きな注目を集めています。
従来のアプローチでは、頻繁なショット (頻繁なショット、豊富なインスタンスを持つラベル)、少数ショット、およびゼロショット学習を個別の課題として扱い、これらのシナリオの 1 つだけにシステムを最適化することがよくあります。
ただし、実際の設定では、ラベルの出現は大きく異なります。
それらの中には、何千回も表示されるものもありますが、散発的にのみ表示されるか、まったく表示されないものもあります。
実際に導入するには、システムがあらゆるラベルの発生に適応できることが重要です。
新しい分類の課題である X ショットを導入します。これは、周波数ショット、少数ショット、およびゼロショットのラベルが事前定義された制限なしで同時に発生する現実世界のコンテキストを反映しています。
ここで、X は 0 から正の無限大までの範囲になります。
X-shot の核心は、オープン ドメインの一般化と、さまざまなラベル シナリオを管理するのに十分な多用途性のシステムを考案することにあります。
X ショットを解決するために、大規模な言語モデルによって提供される弱い監視によって強化された、命令追跡を介した NLP タスクの大規模なコレクションからの間接監視を活用する BinBin (命令追跡に基づくバイナリ推論) を提案します。
BinBin は、複数のドメインにわたる 3 つのベンチマーク データセットにおいて、これまでの最先端の技術を上回っています。
私たちの知る限り、これは X が可変のままの X ショット学習に取り組んだ最初の研究です。
要約(オリジナル)
In recent years, few-shot and zero-shot learning, which learn to predict labels with limited annotated instances, have garnered significant attention. Traditional approaches often treat frequent-shot (freq-shot; labels with abundant instances), few-shot, and zero-shot learning as distinct challenges, optimizing systems for just one of these scenarios. Yet, in real-world settings, label occurrences vary greatly. Some of them might appear thousands of times, while others might only appear sporadically or not at all. For practical deployment, it is crucial that a system can adapt to any label occurrence. We introduce a novel classification challenge: X-shot, reflecting a real-world context where freq-shot, few-shot, and zero-shot labels co-occur without predefined limits. Here, X can span from 0 to positive infinity. The crux of X-shot centers on open-domain generalization and devising a system versatile enough to manage various label scenarios. To solve X-shot, we propose BinBin (Binary INference Based on INstruction following) that leverages the Indirect Supervision from a large collection of NLP tasks via instruction following, bolstered by Weak Supervision provided by large language models. BinBin surpasses previous state-of-the-art techniques on three benchmark datasets across multiple domains. To our knowledge, this is the first work addressing X-shot learning, where X remains variable.
arxiv情報
著者 | Hanzi Xu,Muhao Chen,Lifu Huang,Slobodan Vucetic,Wenpeng Yin |
発行日 | 2024-03-06 17:13:24+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google