cs.LG」カテゴリーアーカイブ

Thought-Augmented Policy Optimization: Bridging External Guidance and Internal Capabilities

要約 強化学習(RL)は、推論モデルをトレーニングするための効果的な方法として浮 … 続きを読む

カテゴリー: cs.CL, cs.LG | Thought-Augmented Policy Optimization: Bridging External Guidance and Internal Capabilities はコメントを受け付けていません

‘KAN you hear me?’ Exploring Kolmogorov-Arnold Networks for Spoken Language Understanding

要約 Kolmogorov-Arnold Networks(KANS)は最近、従 … 続きを読む

カテゴリー: cs.CL, cs.LG, eess.AS | ‘KAN you hear me?’ Exploring Kolmogorov-Arnold Networks for Spoken Language Understanding はコメントを受け付けていません

FLAME-MoE: A Transparent End-to-End Research Platform for Mixture-of-Experts Language Models

要約 Gemini-1.5、Deepseek-V3、Llama-4などの最近の大 … 続きを読む

カテゴリー: cs.CL, cs.LG | FLAME-MoE: A Transparent End-to-End Research Platform for Mixture-of-Experts Language Models はコメントを受け付けていません

Preference-Based Gradient Estimation for ML-Guided Approximate Combinatorial Optimization

要約 組み合わせの最適化(CO)の問題は、医学、物流、製造などの幅広いドメインに … 続きを読む

カテゴリー: cs.AI, cs.LG | Preference-Based Gradient Estimation for ML-Guided Approximate Combinatorial Optimization はコメントを受け付けていません

Proxy-Free GFlowNet

要約 生成フローネットワーク(Gflownets)は、構成オブジェクト上の分布を … 続きを読む

カテゴリー: cs.AI, cs.LG | Proxy-Free GFlowNet はコメントを受け付けていません

Likelihood-Ratio Regularized Quantile Regression: Adapting Conformal Prediction to High-Dimensional Covariate Shifts

要約 共変量シフトの下でのコンフォーマル予測の問題を考慮します。 ソースドメイン … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Likelihood-Ratio Regularized Quantile Regression: Adapting Conformal Prediction to High-Dimensional Covariate Shifts はコメントを受け付けていません

Uncertainty Quantification for LLM-Based Survey Simulations

要約 調査の質問に対する人間の反応をシミュレートし、信頼できる洞察を得るために不 … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ME | Uncertainty Quantification for LLM-Based Survey Simulations はコメントを受け付けていません

Tensorization is a powerful but underexplored tool for compression and interpretability of neural networks

要約 ニューラルネットワークをテンソレイズするには、その密な重量マトリックスの一 … 続きを読む

カテゴリー: cs.AI, cs.LG, quant-ph | Tensorization is a powerful but underexplored tool for compression and interpretability of neural networks はコメントを受け付けていません

Outcome-based Reinforcement Learning to Predict the Future

要約 検証可能な報酬(RLVR)による強化学習は、大規模な言語モデルで数学とコー … 続きを読む

カテゴリー: cs.AI, cs.LG | Outcome-based Reinforcement Learning to Predict the Future はコメントを受け付けていません

Error Optimization: Overcoming Exponential Signal Decay in Deep Predictive Coding Networks

要約 予測コーディング(PC)は、ニューラルネットワークトレーニングのためのバッ … 続きを読む

カテゴリー: cs.AI, cs.LG | Error Optimization: Overcoming Exponential Signal Decay in Deep Predictive Coding Networks はコメントを受け付けていません