Controllable Text Generation for Large Language Models: A Survey

要約

自然言語処理 (NLP) では、大規模言語モデル (LLM) が高いテキスト生成品質を実証しています。
ただし、現実のアプリケーションでは、LLM はますます複雑な要件を満たす必要があります。
LLM は、誤解を招くコンテンツや不適切なコンテンツを回避するだけでなく、特定の文体を模倣したり、詩的豊かなテキストを生成したりするなど、特定のユーザーのニーズに応えることも期待されています。
これらのさまざまな要求により、出力が事前に定義された制御条件 (安全性、感情、テーマの一貫性、言語スタイルなど) に確実に準拠するようにする制御可能なテキスト生成 (CTG) 技術の開発が推進され、有用性、流暢さ、言語表現の高水準が維持されてきました。
そして多様性。
この文書では、LLM 向け CTG の最新の進歩を系統的にレビューし、その中心概念を包括的に定義し、制御条件とテキスト品質の要件を明確にしています。
CTG タスクは、コンテンツ コントロールと属性コントロールという 2 つの主要なタイプに分類されます。
モデルの再トレーニング、微調整、強化学習、プロンプトエンジニアリング、潜在空間操作、デコード時の介入などの主要な方法について説明します。
各方式の特徴、利点、限界を分析し、生成制御を実現するための微妙な洞察を提供します。
さらに、CTG の評価方法をレビューし、領域全体での応用を要約し、流暢性や実用性の低下など、現在の研究における主要な課題に対処します。
また、今後の研究では実世界への応用をより重視するなど、いくつかのアピールを提案します。
このペーパーは、この分野の研究者や開発者に貴重な指針を提供することを目的としています。
参考文献リストと中国語版は、https://github.com/IAAR-Shanghai/CTGSurvey でオープンソース化されています。

要約(オリジナル)

In Natural Language Processing (NLP), Large Language Models (LLMs) have demonstrated high text generation quality. However, in real-world applications, LLMs must meet increasingly complex requirements. Beyond avoiding misleading or inappropriate content, LLMs are also expected to cater to specific user needs, such as imitating particular writing styles or generating text with poetic richness. These varied demands have driven the development of Controllable Text Generation (CTG) techniques, which ensure that outputs adhere to predefined control conditions–such as safety, sentiment, thematic consistency, and linguistic style–while maintaining high standards of helpfulness, fluency, and diversity. This paper systematically reviews the latest advancements in CTG for LLMs, offering a comprehensive definition of its core concepts and clarifying the requirements for control conditions and text quality. We categorize CTG tasks into two primary types: content control and attribute control. The key methods are discussed, including model retraining, fine-tuning, reinforcement learning, prompt engineering, latent space manipulation, and decoding-time intervention. We analyze each method’s characteristics, advantages, and limitations, providing nuanced insights for achieving generation control. Additionally, we review CTG evaluation methods, summarize its applications across domains, and address key challenges in current research, including reduced fluency and practicality. We also propose several appeals, such as placing greater emphasis on real-world applications in future research. This paper aims to offer valuable guidance to researchers and developers in the field. Our reference list and Chinese version are open-sourced at https://github.com/IAAR-Shanghai/CTGSurvey.

arxiv情報

著者 Xun Liang,Hanyu Wang,Yezhaohui Wang,Shichao Song,Jiawei Yang,Simin Niu,Jie Hu,Dan Liu,Shunyu Yao,Feiyu Xiong,Zhiyu Li
発行日 2024-08-22 17:59:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, I.2.7 パーマリンク