cs.LG」カテゴリーアーカイブ

Bottlenecked Transformers: Periodic KV Cache Abstraction for Generalised Reasoning

要約 印象的な能力にもかかわらず、大規模な言語モデルは、トレーニングの分布を超え … 続きを読む

カテゴリー: cs.AI, cs.IT, cs.LG, math.IT | Bottlenecked Transformers: Periodic KV Cache Abstraction for Generalised Reasoning はコメントを受け付けていません

BP-Seg: A graphical model approach to unsupervised and non-contiguous text segmentation using belief propagation

要約 文の意味的な意味に基づくテキストセグメンテーションは、多くのダウンストリー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | BP-Seg: A graphical model approach to unsupervised and non-contiguous text segmentation using belief propagation はコメントを受け付けていません

CASS: Nvidia to AMD Transpilation with Data, Models, and Benchmark

要約 クロスアーキテクチャGPUコードトランスピレーションの最初の大規模データセ … 続きを読む

カテゴリー: cs.AI, cs.AR, cs.CL, cs.LG, cs.PL | CASS: Nvidia to AMD Transpilation with Data, Models, and Benchmark はコメントを受け付けていません

TinyV: Reducing False Negatives in Verification Improves RL for LLM Reasoning

要約 Rehnection Learning(RL)は、報酬信号でポリシーを最適 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | TinyV: Reducing False Negatives in Verification Improves RL for LLM Reasoning はコメントを受け付けていません

Capacity-Aware Inference: Mitigating the Straggler Effect in Mixture of Experts

要約 専門家(MOE)の混合は、まばらな専門家の活性化を活用し、パフォーマンスと … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Capacity-Aware Inference: Mitigating the Straggler Effect in Mixture of Experts はコメントを受け付けていません

Guided Diffusion Sampling on Function Spaces with Applications to PDEs

要約 PDEベースの逆問題における条件付きサンプリングのための一般的なフレームワ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.NA, math.NA, stat.ML | Guided Diffusion Sampling on Function Spaces with Applications to PDEs はコメントを受け付けていません

Understanding Prompt Tuning and In-Context Learning via Meta-Learning

要約 プロンプトは、タスクをターゲットにするために優先モデルを適応させる主な方法 … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Understanding Prompt Tuning and In-Context Learning via Meta-Learning はコメントを受け付けていません

InSTA: Towards Internet-Scale Training For Agents

要約 Webナビゲーションエージェントをトレーニングするための主なアプローチは、 … 続きを読む

カテゴリー: cs.AI, cs.LG | InSTA: Towards Internet-Scale Training For Agents はコメントを受け付けていません

From EduVisBench to EduVisAgent: A Benchmark and Multi-Agent Framework for Pedagogical Visualization

要約 拡散モデルや大規模な視覚言語モデル(LVLMS)などの基礎モデル(FMS) … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | From EduVisBench to EduVisAgent: A Benchmark and Multi-Agent Framework for Pedagogical Visualization はコメントを受け付けていません

ATR-Bench: A Federated Learning Benchmark for Adaptation, Trust, and Reasoning

要約 Federated Learning(FL)は、分散型の参加者全体でデータ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | ATR-Bench: A Federated Learning Benchmark for Adaptation, Trust, and Reasoning はコメントを受け付けていません