cs.LG」カテゴリーアーカイブ

Leveraging Hierarchical Taxonomies in Prompt-based Continual Learning

要約 人間の学習行動からインスピレーションを得たこの研究では、継続的に出現するク … 続きを読む

カテゴリー: cs.LG | コメントする

Loss-to-Loss Prediction: Scaling Laws for All Datasets

要約 スケーリング則は、単一のデータ分布の計算スケール全体で列車損失を予測するた … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | コメントする

Literature Meets Data: A Synergistic Approach to Hypothesis Generation

要約 AI は、仮説生成を含む科学プロセスを変革する可能性を秘めています。 仮説 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CY, cs.LG | コメントする

A Flexible Large Language Models Guardrail Development Methodology Applied to Off-Topic Prompt Detection

要約 大規模な言語モデルは、主題から外れた誤用の傾向があり、ユーザーがこれらのモ … 続きを読む

カテゴリー: 68T50, cs.CL, cs.LG, I.2.7 | コメントする

Does Unlearning Truly Unlearn? A Black Box Evaluation of LLM Unlearning Methods

要約 大規模言語モデルの学習解除は、LLM が学習した有害な情報を削除して、悪意 … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Training Bilingual LMs with Data Constraints in the Targeted Language

要約 大規模な言語モデルは、現在のスケーリング法の要求に従って、Web の大規模 … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

LLMSteer: Improving Long-Context LLM Inference by Steering Attention on Reused Contexts

要約 大規模言語モデル (LLM) は複雑なタスクで優れたパフォーマンスを示しま … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Beyond Isolation: Multi-Agent Synergy for Improving Knowledge Graph Construction

要約 この論文では、ナレッジ グラフ構築 (KGC) における大規模言語モデル … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする

SORSA: Singular Values and Orthonormal Regularized Singular Vectors Adaptation of Large Language Models

要約 この論文では、新しい PEFT 手法である特異値と正規直交正則特異ベクトル … 続きを読む

カテゴリー: cs.CL, cs.LG | コメントする

Closer Look at Efficient Inference Methods: A Survey of Speculative Decoding

要約 大規模言語モデル (LLM) の規模と複雑さが増大するにつれて、大規模言語 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | コメントする