cs.LG」カテゴリーアーカイブ

DYNAMAX: Dynamic computing for Transformers and Mamba based architectures

要約 早期出口(EES)は、データサンプルの満足のいく予測信頼度が達成されたら、 … 続きを読む

カテゴリー: (Primary), 68T07, cs.AI, cs.CL, cs.LG | DYNAMAX: Dynamic computing for Transformers and Mamba based architectures はコメントを受け付けていません

Training Plug-n-Play Knowledge Modules with Deep Context Distillation

要約 特に低データのシナリオで、またはプライベートドキュメントや専門文書を扱う場 … 続きを読む

カテゴリー: cs.AI, cs.LG | Training Plug-n-Play Knowledge Modules with Deep Context Distillation はコメントを受け付けていません

Wanda++: Pruning Large Language Models via Regional Gradients

要約 大規模な言語モデル(LLMS)剪定は、パフォーマンスへの影響を最小限に抑え … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Wanda++: Pruning Large Language Models via Regional Gradients はコメントを受け付けていません

Test-time regression: a unifying framework for designing sequence models with associative memory

要約 シーケンスモデルは、現代の深い学習の中心にあります。 しかし、急速な進歩に … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.NE, stat.ML | Test-time regression: a unifying framework for designing sequence models with associative memory はコメントを受け付けていません

Hubs and Spokes Learning: Efficient and Scalable Collaborative Machine Learning

要約 Federated Learning(FL)と分散学習(P2PL)の強みを … 続きを読む

カテゴリー: cs.AI, cs.DC, cs.LG | Hubs and Spokes Learning: Efficient and Scalable Collaborative Machine Learning はコメントを受け付けていません

Toward Efficient Exploration by Large Language Model Agents

要約 強化学習(RL)内の急成長エリアは、大規模な言語モデル(LLMS)を中心と … 続きを読む

カテゴリー: cs.AI, cs.LG | Toward Efficient Exploration by Large Language Model Agents はコメントを受け付けていません

The Best of Both Worlds: Integrating Language Models and Diffusion Models for Video Generation

要約 テキストからビデオへの最近の進歩(T2V)の生成は、自己回帰言語モデルと拡 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | The Best of Both Worlds: Integrating Language Models and Diffusion Models for Video Generation はコメントを受け付けていません

UniversalRAG: Retrieval-Augmented Generation over Multiple Corpora with Diverse Modalities and Granularities

要約 検索された生成(RAG)は、クエリに関連する外部知識をモデルの応答に接地す … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR, cs.LG | UniversalRAG: Retrieval-Augmented Generation over Multiple Corpora with Diverse Modalities and Granularities はコメントを受け付けていません

Negate or Embrace: On How Misalignment Shapes Multimodal Representation Learning

要約 画像テキストペアを使用したマルチモーダルコントラスト学習(MMCL)によっ … 続きを読む

カテゴリー: cs.CV, cs.LG | Negate or Embrace: On How Misalignment Shapes Multimodal Representation Learning はコメントを受け付けていません

3D ReX: Causal Explanations in 3D Neuroimaging Classification

要約 説明可能性は、医療イメージングにおけるAIモデルにとって重要な問題のままで … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, eess.IV | 3D ReX: Causal Explanations in 3D Neuroimaging Classification はコメントを受け付けていません