cs.LG」カテゴリーアーカイブ

Real-Time Device Reach Forecasting Using HLL and MinHash Data Sketches

要約 ユーザーが指定したターゲティング属性に基づいて、適切な数のテレビ(デバイス … 続きを読む

カテゴリー: 60G25, cs.AI, cs.DB, cs.LG, I.5.3 | Real-Time Device Reach Forecasting Using HLL and MinHash Data Sketches はコメントを受け付けていません

Ray-Tracing for Conditionally Activated Neural Networks

要約 このホワイトペーパーでは、専門家(MOE)層の複数の混合物の階層構造を組み … 続きを読む

カテゴリー: cs.AI, cs.LG | Ray-Tracing for Conditionally Activated Neural Networks はコメントを受け付けていません

Rapid Word Learning Through Meta In-Context Learning

要約 人間は、いくつかの実例から新しい単語を迅速に学び、次に新しい文脈で体系的か … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Rapid Word Learning Through Meta In-Context Learning はコメントを受け付けていません

Optimizing Model Selection for Compound AI Systems

要約 Self RefineやMulti-Agent Debateなどの複数のL … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.MA | Optimizing Model Selection for Compound AI Systems はコメントを受け付けていません

The Computational Limits of State-Space Models and Mamba via the Lens of Circuit Complexity

要約 この論文では、回路の複雑さフレームワークを使用して、MAMBAおよび状態空 … 続きを読む

カテゴリー: cs.AI, cs.CC, cs.CL, cs.LG | The Computational Limits of State-Space Models and Mamba via the Lens of Circuit Complexity はコメントを受け付けていません

Large Language Model Confidence Estimation via Black-Box Access

要約 モデルの応答に対する不確実性または自信を推定することは、応答だけでなく、モ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Large Language Model Confidence Estimation via Black-Box Access はコメントを受け付けていません

Towards Efficient Optimizer Design for LLM via Structured Fisher Approximation with a Low-Rank Extension

要約 低メモリの要件と速い収束を備えた大規模な言語モデル(LLMS)の効率的なオ … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Towards Efficient Optimizer Design for LLM via Structured Fisher Approximation with a Low-Rank Extension はコメントを受け付けていません

Sample, Scrutinize and Scale: Effective Inference-Time Search by Scaling Verification

要約 サンプリングベースの検索は、テスト時間計算を利用するための単純なパラダイム … 続きを読む

カテゴリー: cs.AI, cs.LG | Sample, Scrutinize and Scale: Effective Inference-Time Search by Scaling Verification はコメントを受け付けていません

FR-Spec: Accelerating Large-Vocabulary Language Models via Frequency-Ranked Speculative Sampling

要約 投機的なサンプリングは、ドラフト – ヴェイロ化メカニズムを利 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | FR-Spec: Accelerating Large-Vocabulary Language Models via Frequency-Ranked Speculative Sampling はコメントを受け付けていません

LServe: Efficient Long-sequence LLM Serving with Unified Sparse Attention

要約 大規模な言語モデル(LLM)は、長いシーケンスの処理において顕著な可能性を … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.DC, cs.LG, cs.PF | LServe: Efficient Long-sequence LLM Serving with Unified Sparse Attention はコメントを受け付けていません