要約
自然言語 (NL) フィードバックには、ユーザー エクスペリエンスに関する豊富な情報が含まれています。
既存の研究は、システム全体への適用を無視して、フィードバックを使用して特定の例を改良するインスタンスレベルのアプローチに焦点を当てています。
この論文では、NL フィードバックをシステムレベルで使用できるようにするための一般的なフレームワークを提案します。
より良いモデルを生成するために、フィードバックを使用して人間参加型のプロセスでシステムレベルの設計決定を形式化する方法を示します。
特に、これは以下を通じて行われます。(i) タスクのメトリクス設計。
(ii) モデル応答を改良するための言語モデル プロンプト設計。
検索クエリの生成とダイアログ応答の生成を改善するために、このアプローチの 2 つのケース スタディを実施し、システム レベルのフィードバックの使用の有効性を示します。
私たちは、システム レベルのフィードバックとインスタンス レベルのフィードバックを組み合わせることでさらなる利益がもたらされること、そして人間が書いたインスタンス レベルのフィードバックの方が GPT-3.5 で書かれたものよりもより根拠のある改良がもたらされ、システム構築における人間のフィードバックの重要性の根底にあることを示します。
要約(オリジナル)
Natural language (NL) feedback contains rich information about the user experience. Existing studies focus on an instance-level approach, where feedback is used to refine specific examples, disregarding its system-wide application. This paper proposes a general framework for unlocking the system-level use of NL feedback. We show how to use feedback to formalize system-level design decisions in a human-in-the-loop-process — in order to produce better models. In particular this is done through: (i) metric design for tasks; and (ii) language model prompt design for refining model responses. We conduct two case studies of this approach for improving search query generation and dialog response generation, demonstrating the effectiveness of the use of system-level feedback. We show the combination of system-level feedback and instance-level feedback brings further gains, and that human written instance-level feedback results in more grounded refinements than GPT-3.5 written ones, underlying the importance of human feedback for building systems.
arxiv情報
著者 | Weizhe Yuan,Kyunghyun Cho,Jason Weston |
発行日 | 2023-06-23 16:21:40+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google