月別アーカイブ: 2024年7月

Universal Length Generalization with Turing Programs

要約 長さの汎化とは、短い学習シーケンスから長いテストシーケンスへ外挿する能力の … 続きを読む

カテゴリー: cs.LG | Universal Length Generalization with Turing Programs はコメントを受け付けていません

Improving Conversational Abilities of Quantized Large Language Models via Direct Preference Alignment

要約 大規模言語モデル(LLM)の急速な進歩は、命令チューニングや人間のフィード … 続きを読む

カテゴリー: cs.CL | Improving Conversational Abilities of Quantized Large Language Models via Direct Preference Alignment はコメントを受け付けていません

ALTER: Augmentation for Large-Table-Based Reasoning

要約 大規模言語モデル(LLM)をテーブルベースの推論に使用することは、広範な研 … 続きを読む

カテゴリー: cs.CL | ALTER: Augmentation for Large-Table-Based Reasoning はコメントを受け付けていません

A Case Study on Context-Aware Neural Machine Translation with Multi-Task Learning

要約 文書レベルのニューラル機械翻訳(DocNMT)では、文脈と原文をエンコード … 続きを読む

カテゴリー: cs.CL | A Case Study on Context-Aware Neural Machine Translation with Multi-Task Learning はコメントを受け付けていません

LLMs’ Classification Performance is Overclaimed

要約 AIや人間が解くように設計された多くの分類タスクでは、一般的にデフォルトで … 続きを読む

カテゴリー: cs.CL | LLMs’ Classification Performance is Overclaimed はコメントを受け付けていません

Cactus: Towards Psychological Counseling Conversations using Cognitive Behavioral Theory

要約 近年、心理カウンセリングの需要が大幅に増加している。この急増は、カウンセラ … 続きを読む

カテゴリー: cs.CL | Cactus: Towards Psychological Counseling Conversations using Cognitive Behavioral Theory はコメントを受け付けていません

Noise Contrastive Alignment of Language Models with Explicit Rewards

要約 ユーザの意図は通常、言語モデル(LM)を微調整する際に最大化される評価報酬 … 続きを読む

カテゴリー: cs.CL, cs.LG | Noise Contrastive Alignment of Language Models with Explicit Rewards はコメントを受け付けていません

Mind the Privacy Unit! User-Level Differential Privacy for Language Model Fine-Tuning

要約 大規模言語モデル(LLM)は、多様な領域にわたる複雑なタスクに取り組むため … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | Mind the Privacy Unit! User-Level Differential Privacy for Language Model Fine-Tuning はコメントを受け付けていません

Social Bias Evaluation for Large Language Models Requires Prompt Variations

要約 警告この論文にはステレオタイプとバイアスの例が含まれています。大規模言語モ … 続きを読む

カテゴリー: cs.CL | Social Bias Evaluation for Large Language Models Requires Prompt Variations はコメントを受け付けていません

Enhancing Translation Accuracy of Large Language Models through Continual Pre-Training on Parallel Data

要約 本論文では、事前訓練された大規模言語モデルを並列データ上で継続的に事前訓練 … 続きを読む

カテゴリー: cs.CL | Enhancing Translation Accuracy of Large Language Models through Continual Pre-Training on Parallel Data はコメントを受け付けていません