月別アーカイブ: 2025年4月

Rethinking RL Scaling for Vision Language Models: A Transparent, From-Scratch Framework and Comprehensive Evaluation Scheme

要約 強化学習(RL)は、近年、大規模言語モデルの推論能力を向上させる強い可能性 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Rethinking RL Scaling for Vision Language Models: A Transparent, From-Scratch Framework and Comprehensive Evaluation Scheme はコメントを受け付けていません

Computing High-dimensional Confidence Sets for Arbitrary Distributions

要約 mathbb{R}^d$上の任意の分布の高密度領域を学習する問題を研究する … 続きを読む

カテゴリー: cs.DS, cs.LG, math.ST, stat.ML, stat.TH | Computing High-dimensional Confidence Sets for Arbitrary Distributions はコメントを受け付けていません

Reservoir Computing: A New Paradigm for Neural Networks

要約 リザーバー・コンピューティングの文献レビュー。 人工知能が計算科学の一分野 … 続きを読む

カテゴリー: cs.LG | Reservoir Computing: A New Paradigm for Neural Networks はコメントを受け付けていません

A Dynamic, Ordinal Gaussian Process Item Response Theoretic Model

要約 社会科学者はしばしば、時間と共に変化する潜在特性を推定するために順序指標を … 続きを読む

カテゴリー: cs.LG, stat.ME | A Dynamic, Ordinal Gaussian Process Item Response Theoretic Model はコメントを受け付けていません

Solving the Paint Shop Problem with Flexible Management of Multi-Lane Buffers Using Reinforcement Learning and Action Masking

要約 ペイントショップの問題では、異なる色に割り当てられた車の順序のない入庫順序 … 続きを読む

カテゴリー: cs.LG, math.OC | Solving the Paint Shop Problem with Flexible Management of Multi-Lane Buffers Using Reinforcement Learning and Action Masking はコメントを受け付けていません

MiLo: Efficient Quantized MoE Inference with Mixture of Low-Rank Compensators

要約 膨大なパラメータを持つMoE(Mixture-of-Experts)モデル … 続きを読む

カテゴリー: cs.LG | MiLo: Efficient Quantized MoE Inference with Mixture of Low-Rank Compensators はコメントを受け付けていません

When Can You Trust Your Explanations? A Robustness Analysis on Feature Importances

要約 最近の法規制により、説明可能で透明性の高い人工知能システムの必要性が強調さ … 続きを読む

カテゴリー: cs.LG | When Can You Trust Your Explanations? A Robustness Analysis on Feature Importances はコメントを受け付けていません

Integrating Human Knowledge Through Action Masking in Reinforcement Learning for Operations Research

要約 強化学習(RL)は、オペレーションズ・リサーチにおける問題に対処するための … 続きを読む

カテゴリー: cs.LG, math.OC | Integrating Human Knowledge Through Action Masking in Reinforcement Learning for Operations Research はコメントを受け付けていません

End-To-End Self-Tuning Self-Supervised Time Series Anomaly Detection

要約 時系列異常検出(TSAD)は、環境センサー、産業KPI、患者バイオマーカー … 続きを読む

カテゴリー: cs.LG | End-To-End Self-Tuning Self-Supervised Time Series Anomaly Detection はコメントを受け付けていません

Compositionality Unlocks Deep Interpretable Models

要約 我々は$chi$-netを提案する。$chi$-netは、テンソルネットワ … 続きを読む

カテゴリー: cs.LG | Compositionality Unlocks Deep Interpretable Models はコメントを受け付けていません