-
最近の投稿
- Computing High-dimensional Confidence Sets for Arbitrary Distributions
- Reservoir Computing: A New Paradigm for Neural Networks
- A Dynamic, Ordinal Gaussian Process Item Response Theoretic Model
- Solving the Paint Shop Problem with Flexible Management of Multi-Lane Buffers Using Reinforcement Learning and Action Masking
- MiLo: Efficient Quantized MoE Inference with Mixture of Low-Rank Compensators
-
最近のコメント
表示できるコメントはありません。 cs.AI (36107) cs.CL (27319) cs.CR (2749) cs.CV (41949) cs.LG (41080) cs.RO (21304) cs.SY (3219) eess.IV (4921) eess.SY (3213) stat.ML (5380)
「stat.ML」カテゴリーアーカイブ
Learning to Solve Related Linear Systems
要約 複数のパラメータ化された関連システムを解決することは、多くの数値タスクの重 … 続きを読む
Calibration Strategies for Robust Causal Estimation: Theoretical and Empirical Insights on Propensity Score Based Estimators
要約 推定とキャリブレーションのためのデータのパーティション化は、逆確率重み付け … 続きを読む
On Quantum Perceptron Learning via Quantum Search
要約 量子機械学習への関心が高まっているため、Perceptronは、従来の機械 … 続きを読む
SNPL: Simultaneous Policy Learning and Evaluation for Safe Multi-Objective Policy Improvement
要約 効果的なデジタル介入を設計するために、実験者は、オフラインデータを使用して … 続きを読む
Primal Methods for Variational Inequality Problems with Functional Constraints
要約 機械学習や運用研究を含むさまざまな分野での幅広いアプリケーションでは、変動 … 続きを読む
Capturing Individual Human Preferences with Reward Features
要約 人間のフィードバックからの強化学習は通常、人々を区別しない報酬モデルを使用 … 続きを読む
Quantum Algorithms for the Pathwise Lasso
要約 古典的なLARS(最小角度回帰)経路ごとのアルゴリズムに基づいて、$ \ … 続きを読む
Sparse Nonparametric Contextual Bandits
要約 このペーパーでは、関連する機能を同時に学習し、文脈上の盗賊の問題の後悔を最 … 続きを読む
Multi-Output Distributional Fairness via Post-Processing
要約 後処理アプローチは、直感性、計算コストの低さ、優れたスケーラビリティのため … 続きを読む
Sample Efficient Preference Alignment in LLMs via Active Exploration
要約 嗜好ベースのフィードバックは、報酬機能の評価が実行不可能な機械学習における … 続きを読む