「cs.CL」カテゴリーアーカイブ

Regurgitative Training: The Value of Real Data in Training Large Language Models

投稿日: 2024年7月26日作成者: jarxiv

要約他の LLM によって少なくとも部分的に生成されたデータを使用して、新しい … 続きを読む →

カテゴリー: cs.AI, cs.CL, stat.ML | コメントを受け付けていません

When Linear Attention Meets Autoregressive Decoding: Towards More Effective and Efficient Linearized Large Language Models

投稿日: 2024年7月26日作成者: jarxiv

要約自己回帰大規模言語モデル (LLM) は、言語タスクで目覚ましいパフォーマ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

ShiftAddLLM: Accelerating Pretrained LLMs via Post-Training Multiplication-Less Reparameterization

投稿日: 2024年7月26日作成者: jarxiv

要約大規模言語モデル (LLM) は、言語タスクで優れたパフォーマンスを示して … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Exploring Scaling Trends in LLM Robustness

投稿日: 2024年7月26日作成者: jarxiv

要約言語モデルの機能は、モデルのサイズとトレーニングデータをスケーリングする … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG, I.2.7 | コメントを受け付けていません

Recursive Introspection: Teaching Language Model Agents How to Self-Improve

投稿日: 2024年7月26日作成者: jarxiv

要約基礎モデルでインテリジェントなエージェントの動作を可能にするための中心的な … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

LoRA-Pro: Are Low-Rank Adapters Properly Optimized?

投稿日: 2024年7月26日作成者: jarxiv

要約 LoRA としても知られる低ランク適応は、元の行列を 2 つの低ランク行列 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

RestoreAgent: Autonomous Image Restoration Agent via Multimodal Large Language Models

投稿日: 2024年7月26日作成者: jarxiv

要約モバイルデバイスでキャプチャされた自然画像には、ノイズ、ぼやけ、低照度な … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

A Unified Framework for Model Editing

投稿日: 2024年7月26日作成者: jarxiv

要約 ROME と MEMIT は 2 つの異なるモデル編集アルゴリズムであると … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

SAFETY-J: Evaluating Safety with Critique

投稿日: 2024年7月26日作成者: jarxiv

要約コンテンツ生成におけるラージ言語モデル (LLM) の導入は、特にコンテン … 続きを読む →

カテゴリー: cs.CL | コメントを受け付けていません

Behavioral Testing: Can Large Language Models Implicitly Resolve Ambiguous Entities?

投稿日: 2024年7月26日作成者: jarxiv

要約大規模言語モデル (LLM) の驚異的なパフォーマンスに貢献する主な側面の … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

「cs.CL」カテゴリーアーカイブ

Regurgitative Training: The Value of Real Data in Training Large Language Models

When Linear Attention Meets Autoregressive Decoding: Towards More Effective and Efficient Linearized Large Language Models

ShiftAddLLM: Accelerating Pretrained LLMs via Post-Training Multiplication-Less Reparameterization

Exploring Scaling Trends in LLM Robustness

Recursive Introspection: Teaching Language Model Agents How to Self-Improve

LoRA-Pro: Are Low-Rank Adapters Properly Optimized?

RestoreAgent: Autonomous Image Restoration Agent via Multimodal Large Language Models

A Unified Framework for Model Editing

SAFETY-J: Evaluating Safety with Critique

Behavioral Testing: Can Large Language Models Implicitly Resolve Ambiguous Entities?

最近の投稿

最近のコメント

アーカイブ

カテゴリー