cs.CL」カテゴリーアーカイブ

Regurgitative Training: The Value of Real Data in Training Large Language Models

要約 他の LLM によって少なくとも部分的に生成されたデータを使用して、新しい … 続きを読む

カテゴリー: cs.AI, cs.CL, stat.ML | Regurgitative Training: The Value of Real Data in Training Large Language Models はコメントを受け付けていません

When Linear Attention Meets Autoregressive Decoding: Towards More Effective and Efficient Linearized Large Language Models

要約 自己回帰大規模言語モデル (LLM) は、言語タスクで目覚ましいパフォーマ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | When Linear Attention Meets Autoregressive Decoding: Towards More Effective and Efficient Linearized Large Language Models はコメントを受け付けていません

ShiftAddLLM: Accelerating Pretrained LLMs via Post-Training Multiplication-Less Reparameterization

要約 大規模言語モデル (LLM) は、言語タスクで優れたパフォーマンスを示して … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | ShiftAddLLM: Accelerating Pretrained LLMs via Post-Training Multiplication-Less Reparameterization はコメントを受け付けていません

Exploring Scaling Trends in LLM Robustness

要約 言語モデルの機能は、モデルのサイズとトレーニング データをスケーリングする … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG, I.2.7 | Exploring Scaling Trends in LLM Robustness はコメントを受け付けていません

Recursive Introspection: Teaching Language Model Agents How to Self-Improve

要約 基礎モデルでインテリジェントなエージェントの動作を可能にするための中心的な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Recursive Introspection: Teaching Language Model Agents How to Self-Improve はコメントを受け付けていません

LoRA-Pro: Are Low-Rank Adapters Properly Optimized?

要約 LoRA としても知られる低ランク適応は、元の行列を 2 つの低ランク行列 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | LoRA-Pro: Are Low-Rank Adapters Properly Optimized? はコメントを受け付けていません

RestoreAgent: Autonomous Image Restoration Agent via Multimodal Large Language Models

要約 モバイル デバイスでキャプチャされた自然画像には、ノイズ、ぼやけ、低照度な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | RestoreAgent: Autonomous Image Restoration Agent via Multimodal Large Language Models はコメントを受け付けていません

A Unified Framework for Model Editing

要約 ROME と MEMIT は 2 つの異なるモデル編集アルゴリズムであると … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | A Unified Framework for Model Editing はコメントを受け付けていません

SAFETY-J: Evaluating Safety with Critique

要約 コンテンツ生成におけるラージ言語モデル (LLM) の導入は、特にコンテン … 続きを読む

カテゴリー: cs.CL | SAFETY-J: Evaluating Safety with Critique はコメントを受け付けていません

Behavioral Testing: Can Large Language Models Implicitly Resolve Ambiguous Entities?

要約 大規模言語モデル (LLM) の驚異的なパフォーマンスに貢献する主な側面の … 続きを読む

カテゴリー: cs.CL, cs.LG | Behavioral Testing: Can Large Language Models Implicitly Resolve Ambiguous Entities? はコメントを受け付けていません