「cs.LG」カテゴリーアーカイブ

Thought-Augmented Policy Optimization: Bridging External Guidance and Internal Capabilities

投稿日: 2025年5月27日作成者: jarxiv

要約強化学習（RL）は、推論モデルをトレーニングするための効果的な方法として浮 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

‘KAN you hear me?’ Exploring Kolmogorov-Arnold Networks for Spoken Language Understanding

投稿日: 2025年5月27日作成者: jarxiv

要約 Kolmogorov-Arnold Networks（KANS）は最近、従 … 続きを読む →

カテゴリー: cs.CL, cs.LG, eess.AS | コメントを受け付けていません

FLAME-MoE: A Transparent End-to-End Research Platform for Mixture-of-Experts Language Models

投稿日: 2025年5月27日作成者: jarxiv

要約 Gemini-1.5、Deepseek-V3、Llama-4などの最近の大 … 続きを読む →

カテゴリー: cs.CL, cs.LG | コメントを受け付けていません

Preference-Based Gradient Estimation for ML-Guided Approximate Combinatorial Optimization

投稿日: 2025年5月27日作成者: jarxiv

要約組み合わせの最適化（CO）の問題は、医学、物流、製造などの幅広いドメインに … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Proxy-Free GFlowNet

投稿日: 2025年5月27日作成者: jarxiv

要約生成フローネットワーク（Gflownets）は、構成オブジェクト上の分布を … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Likelihood-Ratio Regularized Quantile Regression: Adapting Conformal Prediction to High-Dimensional Covariate Shifts

投稿日: 2025年5月27日作成者: jarxiv

要約共変量シフトの下でのコンフォーマル予測の問題を考慮します。ソースドメイン … 続きを読む →

カテゴリー: cs.AI, cs.LG, stat.ML | コメントを受け付けていません

Uncertainty Quantification for LLM-Based Survey Simulations

投稿日: 2025年5月27日作成者: jarxiv

要約調査の質問に対する人間の反応をシミュレートし、信頼できる洞察を得るために不 … 続きを読む →

カテゴリー: cs.AI, cs.LG, stat.ME | コメントを受け付けていません

Tensorization is a powerful but underexplored tool for compression and interpretability of neural networks

投稿日: 2025年5月27日作成者: jarxiv

要約ニューラルネットワークをテンソレイズするには、その密な重量マトリックスの一 … 続きを読む →

カテゴリー: cs.AI, cs.LG, quant-ph | コメントを受け付けていません

Outcome-based Reinforcement Learning to Predict the Future

投稿日: 2025年5月27日作成者: jarxiv

要約検証可能な報酬（RLVR）による強化学習は、大規模な言語モデルで数学とコー … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Error Optimization: Overcoming Exponential Signal Decay in Deep Predictive Coding Networks

投稿日: 2025年5月27日作成者: jarxiv

要約予測コーディング（PC）は、ニューラルネットワークトレーニングのためのバッ … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Thought-Augmented Policy Optimization: Bridging External Guidance and Internal Capabilities

‘KAN you hear me?’ Exploring Kolmogorov-Arnold Networks for Spoken Language Understanding

FLAME-MoE: A Transparent End-to-End Research Platform for Mixture-of-Experts Language Models

Preference-Based Gradient Estimation for ML-Guided Approximate Combinatorial Optimization

Proxy-Free GFlowNet

Likelihood-Ratio Regularized Quantile Regression: Adapting Conformal Prediction to High-Dimensional Covariate Shifts

Uncertainty Quantification for LLM-Based Survey Simulations

Tensorization is a powerful but underexplored tool for compression and interpretability of neural networks

Outcome-based Reinforcement Learning to Predict the Future

Error Optimization: Overcoming Exponential Signal Decay in Deep Predictive Coding Networks

最近の投稿

最近のコメント

アーカイブ

カテゴリー