cs.CL」カテゴリーアーカイブ

Does Writing with Language Models Reduce Content Diversity?

要約 大規模言語モデル (LLM) により、モデル支援を利用した共同執筆が急増し … 続きを読む

カテゴリー: cs.CL, cs.CY, cs.HC, cs.LG | Does Writing with Language Models Reduce Content Diversity? はコメントを受け付けていません

Predicting Text Preference Via Structured Comparative Reasoning

要約 比較推論はテキストの好みの予測において重要な役割を果たします。 ただし、大 … 続きを読む

カテゴリー: cs.CL | Predicting Text Preference Via Structured Comparative Reasoning はコメントを受け付けていません

Safe and Responsible Large Language Model : Can We Balance Bias Reduction and Language Understanding in Large Language Models?

要約 大規模言語モデル (LLM) により、さまざまな NLP タスクが大幅に進 … 続きを読む

カテゴリー: cs.CL | Safe and Responsible Large Language Model : Can We Balance Bias Reduction and Language Understanding in Large Language Models? はコメントを受け付けていません

WaterBench: Towards Holistic Evaluation of Watermarks for Large Language Models

要約 大規模言語モデル (LLM) の潜在的な誤用を軽減するために、最近の研究で … 続きを読む

カテゴリー: cs.AI, cs.CL | WaterBench: Towards Holistic Evaluation of Watermarks for Large Language Models はコメントを受け付けていません

RouteLLM: Learning to Route LLMs with Preference Data

要約 大規模言語モデル (LLM) は、幅広いタスクにわたって優れた機能を発揮し … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | RouteLLM: Learning to Route LLMs with Preference Data はコメントを受け付けていません

Benchmarking Mental State Representations in Language Models

要約 心の理論による推論を必要とするタスクに対する言語モデル (LM) の生成パ … 続きを読む

カテゴリー: cs.AI, cs.CL | Benchmarking Mental State Representations in Language Models はコメントを受け付けていません

Assessing the Brittleness of Safety Alignment via Pruning and Low-Rank Modifications

要約 大規模言語モデル (LLM) は、ジェイルブレイクや、さらには悪意のない微 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Assessing the Brittleness of Safety Alignment via Pruning and Low-Rank Modifications はコメントを受け付けていません

Is one brick enough to break the wall of spoken dialogue state tracking?

要約 タスク指向対話 (TOD) システムでは、ユーザーの要求に対するシステムの … 続きを読む

カテゴリー: cs.AI, cs.CL, eess.AS, eess.SP | Is one brick enough to break the wall of spoken dialogue state tracking? はコメントを受け付けていません

How Reliable Are Automatic Evaluation Methods for Instruction-Tuned LLMs?

要約 命令調整された大規模言語モデル (LLM) の取り組みでは、人間による評価 … 続きを読む

カテゴリー: cs.AI, cs.CL | How Reliable Are Automatic Evaluation Methods for Instruction-Tuned LLMs? はコメントを受け付けていません

Textual Similarity as a Key Metric in Machine Translation Quality Estimation

要約 機械翻訳 (MT) 品質評価 (QE) は、参考テキストなしで翻訳の信頼性 … 続きを読む

カテゴリー: cs.AI, cs.CL | Textual Similarity as a Key Metric in Machine Translation Quality Estimation はコメントを受け付けていません