投稿者「jarxiv」のアーカイブ

Improving large language models with concept-aware fine-tuning

要約 大規模な言語モデル(LLM)は、現代AIの基礎となっています。 ただし、次 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Improving large language models with concept-aware fine-tuning はコメントを受け付けていません

Beyond Numeric Rewards: In-Context Dueling Bandits with LLM Agents

要約 コンテキスト内補強学習(ICRL)は、基礎モデルの時代の強化学習(RL)の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Beyond Numeric Rewards: In-Context Dueling Bandits with LLM Agents はコメントを受け付けていません

Learning to Focus: Causal Attention Distillation via Gradient-Guided Token Pruning

要約 大規模な言語モデル(LLM)は、コンテキストの理解に大幅な改善を実証してい … 続きを読む

カテゴリー: cs.CL | Learning to Focus: Causal Attention Distillation via Gradient-Guided Token Pruning はコメントを受け付けていません

Introspective Growth: Automatically Advancing LLM Expertise in Technology Judgment

要約 大規模な言語モデル(LLM)は、概念的な理解の兆候をますます示していますが … 続きを読む

カテゴリー: cs.CL, cs.CY, cs.DL, cs.IR | Introspective Growth: Automatically Advancing LLM Expertise in Technology Judgment はコメントを受け付けていません

MEMOIR: Lifelong Model Editing with Minimal Overwrite and Informed Retention for LLMs

要約 実際のシステムに展開された言語モデルは、多くの場合、新しい知識または修正さ … 続きを読む

カテゴリー: cs.CL, cs.LG | MEMOIR: Lifelong Model Editing with Minimal Overwrite and Informed Retention for LLMs はコメントを受け付けていません

Dynamic-SUPERB Phase-2: A Collaboratively Expanding Benchmark for Measuring the Capabilities of Spoken Language Models with 180 Tasks

要約 GeminiやChatGptなどのマルチモーダルファンデーションモデルは、 … 続きを読む

カテゴリー: cs.CL, eess.AS | Dynamic-SUPERB Phase-2: A Collaboratively Expanding Benchmark for Measuring the Capabilities of Spoken Language Models with 180 Tasks はコメントを受け付けていません

Quantum Graph Transformer for NLP Sentiment Classification

要約 量子機械学習は、特に複雑で構造化されたデータが重要であるドメインで、より効 … 続きを読む

カテゴリー: cs.CL, quant-ph | Quantum Graph Transformer for NLP Sentiment Classification はコメントを受け付けていません

Statistical Hypothesis Testing for Auditing Robustness in Language Models

要約 入力摂動など、任意の介入の下で大規模な言語モデル(LLM)システムの出力が … 続きを読む

カテゴリー: cs.CL | Statistical Hypothesis Testing for Auditing Robustness in Language Models はコメントを受け付けていません

Language Models over Canonical Byte-Pair Encodings

要約 現代の言語モデルは、バイトペアエンコーディングなどの決定論的トークン剤を介 … 続きを読む

カテゴリー: cs.CL, cs.FL, cs.LG | Language Models over Canonical Byte-Pair Encodings はコメントを受け付けていません

General-Reasoner: Advancing LLM Reasoning Across All Domains

要約 強化学習(RL)は最近、大規模な言語モデル(LLM)の推論能力を高める上で … 続きを読む

カテゴリー: cs.CL | General-Reasoner: Advancing LLM Reasoning Across All Domains はコメントを受け付けていません