BUCA: A Binary Classification Approach to Unsupervised Commonsense Question Answering

要約

監視されていない常識推論(UCR)は、常識的な推論データセットの構築が高価であり、範囲が必然的に制限されているため、ますます人気が高まっています。
UCRへの一般的なアプローチは、外部の知識(知識グラフなど)で言語モデルを微調整することですが、これには通常、多数のトレーニングの例が必要です。
このホワイトペーパーでは、下流の多肢選択質問タスクを、合理性に応じてすべての候補者の回答をランク付けすることにより、より単純なバイナリ分類タスクに変換することを提案します。
この目的のために、モデルをトレーニングするために、知識グラフを合理的で不合理なテキストに変換します。
広範な実験結果は、さまざまな多肢選択質問に及ぼすアプローチの有効性を示しています。
さらに、KGSを使用した既存のUCRアプローチと比較して、私たちのアプローチは空腹のデータが少なくなります。
当社のコードは、https://github.com/probe2/bucaで入手できます。

要約(オリジナル)

Unsupervised commonsense reasoning (UCR) is becoming increasingly popular as the construction of commonsense reasoning datasets is expensive, and they are inevitably limited in their scope. A popular approach to UCR is to fine-tune language models with external knowledge (e.g., knowledge graphs), but this usually requires a large number of training examples. In this paper, we propose to transform the downstream multiple choice question answering task into a simpler binary classification task by ranking all candidate answers according to their reasonableness. To this end, for training the model, we convert the knowledge graph triples into reasonable and unreasonable texts. Extensive experimental results show the effectiveness of our approach on various multiple choice question answering benchmarks. Furthermore, compared with existing UCR approaches using KGs, ours is less data hungry. Our code is available at https://github.com/probe2/BUCA.

arxiv情報

著者 Jie He,Simon Chi Lok U,Víctor Gutiérrez-Basulto,Jeff Z. Pan
発行日 2025-04-11 14:36:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク