月別アーカイブ: 2024年2月

Decentralized Bilevel Optimization over Graphs: Loopless Algorithmic Update and Transient Iteration Complexity

要約 確率的二値最適化 (SBO) は、入れ子構造の処理における汎用性により、機 … 続きを読む

カテゴリー: cs.LG, math.OC, stat.ML | Decentralized Bilevel Optimization over Graphs: Loopless Algorithmic Update and Transient Iteration Complexity はコメントを受け付けていません

SADMoE: Exploiting Activation Sparsity with Dynamic-k Gating

要約 変圧器モデルは、その優れたパフォーマンスにもかかわらず、高い計算要件が原因 … 続きを読む

カテゴリー: cs.LG | SADMoE: Exploiting Activation Sparsity with Dynamic-k Gating はコメントを受け付けていません

Generative Pretrained Hierarchical Transformer for Time Series Forecasting

要約 最近の取り組みは、高度なネットワーク アーキテクチャと自己監視型の事前トレ … 続きを読む

カテゴリー: cs.LG | Generative Pretrained Hierarchical Transformer for Time Series Forecasting はコメントを受け付けていません

Discovering Artificial Viscosity Models for Discontinuous Galerkin Approximation of Conservation Laws using Physics-Informed Machine Learning

要約 有限要素ベースの保存則の高次ソルバーは高い精度を提供しますが、ギブス現象に … 続きを読む

カテゴリー: 35L65, 65M60, 68T01, cs.LG, cs.NA, math.NA | Discovering Artificial Viscosity Models for Discontinuous Galerkin Approximation of Conservation Laws using Physics-Informed Machine Learning はコメントを受け付けていません

RepairLLaMA: Efficient Representations and Fine-Tuned Adapters for Program Repair

要約 自動プログラム修復 (APR) は、大規模言語モデル (LLM) の出現に … 続きを読む

カテゴリー: cs.LG, cs.SE | RepairLLaMA: Efficient Representations and Fine-Tuned Adapters for Program Repair はコメントを受け付けていません

Model-based deep reinforcement learning for accelerated learning from flow simulations

要約 近年、閉ループフロー制御問題を解決する手法として深層強化学習が登場しました … 続きを読む

カテゴリー: cs.CE, cs.LG, physics.flu-dyn | Model-based deep reinforcement learning for accelerated learning from flow simulations はコメントを受け付けていません

Label Learning Method Based on Tensor Projection

要約 アンカーグラフに基づくマルチビュークラスタリング手法は、その効率性と有効性 … 続きを読む

カテゴリー: cs.LG | Label Learning Method Based on Tensor Projection はコメントを受け付けていません

Chain-of-Discussion: A Multi-Model Framework for Complex Evidence-Based Question Answering

要約 自由回答型の質問応答では、モデルが適切な証拠を見つけて、論理的で包括的で役 … 続きを読む

カテゴリー: cs.AI, cs.CL | Chain-of-Discussion: A Multi-Model Framework for Complex Evidence-Based Question Answering はコメントを受け付けていません

Data-freeWeight Compress and Denoise for Large Language Models

要約 大規模言語モデル (LLM) は、特にモデル パラメーターが大幅にスケール … 続きを読む

カテゴリー: cs.CL | Data-freeWeight Compress and Denoise for Large Language Models はコメントを受け付けていません

Learning to Learn for Few-shot Continual Active Learning

要約 継続的な学習は、新しい領域での可塑性を実証しながら、以前に見たタスクを解決 … 続きを読む

カテゴリー: cs.CL, cs.LG | Learning to Learn for Few-shot Continual Active Learning はコメントを受け付けていません