cs.LG」カテゴリーアーカイブ

Training Bilingual LMs with Data Constraints in the Targeted Language

要約 大規模な言語モデルは、現在のスケーリング法の要求に従って、Web の大規模 … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

LLMSteer: Improving Long-Context LLM Inference by Steering Attention on Reused Contexts

要約 大規模言語モデル (LLM) は複雑なタスクで優れたパフォーマンスを示しま … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Beyond Isolation: Multi-Agent Synergy for Improving Knowledge Graph Construction

要約 この論文では、ナレッジ グラフ構築 (KGC) における大規模言語モデル … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

SORSA: Singular Values and Orthonormal Regularized Singular Vectors Adaptation of Large Language Models

要約 この論文では、新しい PEFT 手法である特異値と正規直交正則特異ベクトル … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Closer Look at Efficient Inference Methods: A Survey of Speculative Decoding

要約 大規模言語モデル (LLM) の規模と複雑さが増大するにつれて、大規模言語 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

Predicting User Intents and Musical Attributes from Music Discovery Conversations

要約 意図分類は、入力テキスト クエリからユーザーのニーズを特定するテキスト理解 … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SD, eess.AS | コメントする

Neuron Patching: Semantic-based Neuron-level Language Model Repair for Code Generation

要約 言語モデル (LM) は、ソフトウェア エンジニアリング、特にコード生成な … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.SE | コメントする

On the Way to LLM Personalization: Learning to Remember User Conversations

要約 大規模言語モデル (LLM) は、さまざまなタスクの貴重なアシスタントとし … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

WaterPark: A Robustness Assessment of Language Model Watermarking

要約 偽情報、自動フィッシング、学術不正行為などの大規模言語モデル (LLM) … 続きを読む

カテゴリー: cs.CL, cs.CR, cs.LG | コメントする

From Decoding to Meta-Generation: Inference-time Algorithms for Large Language Models

要約 大規模言語モデル (LLM) に関する最新の研究で最も顕著な発見の 1 つ … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする