JsonTuning: Towards Generalizable, Robust, and Controllable Instruction Tuning

要約

命令チューニングは、明示的なタスク命令を提供することで大規模言語モデル (LLM) の機能を活用するための重要なプロセスとして浮上し、さまざまなタスクのパフォーマンスの向上につながります。
ただし、一般的なテキスト間命令チューニング (TextTuning) メソッドは、タスクのあいまいさと明示的な構造の欠如により、一般化、堅牢性、および制御性の点で制限を受けています。
この論文では、命令チューニングのための新しい構造間アプローチである JsonTuning を提案します。
JsonTuning は、JSON の多用途性と構造化された性質を活用してタスクを表現することで、モデルが重要なタスク要素とその関係を理解できるようにすることで一般化を強化し、あいまいさを最小限に抑えて堅牢性を向上させ、出力に対する明示的な制御を提供することで制御性を高めます。
多様な言語モデルと評価ベンチマークを用いて包括的な比較調査を実施します。
実験結果は、JsonTuning がさまざまなアプリケーションで TextTuning よりも優れたパフォーマンスを示し、パフォーマンス、適応性、堅牢性、および制御性が向上していることを示しています。
TextTuning の制限を克服することで、JsonTuning は、多様なシナリオを処理できる、より効果的で信頼性の高い LLM の大きな可能性を実証します。

要約(オリジナル)

Instruction tuning has emerged as a crucial process for harnessing the capabilities of large language models (LLMs) by providing explicit task instructions, leading to improved performance in various tasks. However, prevalent text-to-text instruction tuning (TextTuning) methods suffer from limitations in generalization, robustness, and controllability due to the ambiguity and lack of explicit structure in tasks. In this paper, we propose JsonTuning, a novel structure-to-structure approach for instruction tuning. By leveraging the versatility and structured nature of JSON to represent tasks, JsonTuning enhances generalization by helping the model understand essential task elements and their relations, improves robustness by minimizing ambiguity, and increases controllability by providing explicit control over the output. We conduct a comprehensive comparative study with diverse language models and evaluation benchmarks. Experimental results show that JsonTuning outperforms TextTuning in various applications, showcasing improved performance, adaptability, robustness, and controllability. By overcoming the limitations of TextTuning, JsonTuning demonstrates significant potential for more effective and reliable LLMs capable of handling diverse scenarios.

arxiv情報

著者 Chang Gao,Wenxuan Zhang,Guizhen Chen,Wai Lam
発行日 2023-10-04 16:44:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク