cs.PF」カテゴリーアーカイブ

Off-the-Shelf Neural Network Architectures for Forex Time Series Prediction come at a Cost

要約 私たちの研究は、さまざまな長期短期記憶 (LSTM) ニューラル ネットワ … 続きを読む

カテゴリー: cs.AI, cs.CE, cs.LG, cs.PF | Off-the-Shelf Neural Network Architectures for Forex Time Series Prediction come at a Cost はコメントを受け付けていません

LFED: A Literary Fiction Evaluation Dataset for Large Language Models

要約 大規模言語モデル (LLM) の急速な進化により、さまざまな側面にわたって … 続きを読む

カテゴリー: cs.CL, cs.PF | LFED: A Literary Fiction Evaluation Dataset for Large Language Models はコメントを受け付けていません

Stochastic Q-learning for Large Discrete Action Spaces

要約 大規模な離散アクション空間を持つ複雑な環境では、強化学習 (RL) におい … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.PF, cs.RO, stat.ML | Stochastic Q-learning for Large Discrete Action Spaces はコメントを受け付けていません

A 4D Hybrid Algorithm to Scale Parallel Training to Thousands of GPUs

要約 大量の通信、特に集団操作は、10 億パラメータのニューラル ネットワークの … 続きを読む

カテゴリー: cs.AI, cs.DC, cs.LG, cs.PF | A 4D Hybrid Algorithm to Scale Parallel Training to Thousands of GPUs はコメントを受け付けていません

QServe: W4A8KV4 Quantization and System Co-design for Efficient LLM Serving

要約 量子化により、大規模言語モデル (LLM) 推論を高速化できます。 研究コ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.PF | QServe: W4A8KV4 Quantization and System Co-design for Efficient LLM Serving はコメントを受け付けていません

QServe: W4A8KV4 Quantization and System Co-design for Efficient LLM Serving

要約 量子化により、大規模言語モデル (LLM) 推論を高速化できます。 研究コ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.PF | QServe: W4A8KV4 Quantization and System Co-design for Efficient LLM Serving はコメントを受け付けていません

Learning to Defer in Content Moderation: The Human-AI Interplay

要約 オンライン プラットフォームでコンテンツ モデレーションを成功させるには、 … 続きを読む

カテゴリー: cs.AI, cs.GT, cs.HC, cs.LG, cs.PF | Learning to Defer in Content Moderation: The Human-AI Interplay はコメントを受け付けていません

Learning Performance-Improving Code Edits

要約 ムーアの法則の衰退により、プログラムのパフォーマンスの最適化がソフトウェア … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.PF, cs.SE | Learning Performance-Improving Code Edits はコメントを受け付けていません

Worst-Case Convergence Time of ML Algorithms via Extreme Value Theory

要約 この論文では、極値の統計を利用して、機械学習アルゴリズムの最悪の場合の収束 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.PF, cs.PL, cs.SE | Worst-Case Convergence Time of ML Algorithms via Extreme Value Theory はコメントを受け付けていません

A 4D Hybrid Algorithm to Scale Parallel Training to Thousands of GPUs

要約 分散システム上で最先端のニューラル ネットワークをトレーニングする場合、多 … 続きを読む

カテゴリー: cs.AI, cs.DC, cs.LG, cs.PF | A 4D Hybrid Algorithm to Scale Parallel Training to Thousands of GPUs はコメントを受け付けていません