stat.ML」カテゴリーアーカイブ

Capturing Individual Human Preferences with Reward Features

要約 人間のフィードバックからの強化学習は通常、人々を区別しない報酬モデルを使用 … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Capturing Individual Human Preferences with Reward Features はコメントを受け付けていません

Quantum Algorithms for the Pathwise Lasso

要約 古典的なLARS(最小角度回帰)経路ごとのアルゴリズムに基づいて、$ \ … 続きを読む

カテゴリー: cs.LG, math.OC, quant-ph, stat.ML | Quantum Algorithms for the Pathwise Lasso はコメントを受け付けていません

Sparse Nonparametric Contextual Bandits

要約 このペーパーでは、関連する機能を同時に学習し、文脈上の盗賊の問題の後悔を最 … 続きを読む

カテゴリー: cs.LG, stat.ML | Sparse Nonparametric Contextual Bandits はコメントを受け付けていません

Multi-Output Distributional Fairness via Post-Processing

要約 後処理アプローチは、直感性、計算コストの低さ、優れたスケーラビリティのため … 続きを読む

カテゴリー: cs.AI, cs.CY, cs.LG, stat.ML | Multi-Output Distributional Fairness via Post-Processing はコメントを受け付けていません

Sample Efficient Preference Alignment in LLMs via Active Exploration

要約 嗜好ベースのフィードバックは、報酬機能の評価が実行不可能な機械学習における … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Sample Efficient Preference Alignment in LLMs via Active Exploration はコメントを受け付けていません

Online federated learning framework for classification

要約 このホワイトペーパーでは、データプライバシーと計算効率を確保しながら、複数 … 続きを読む

カテゴリー: cs.LG, stat.ML | Online federated learning framework for classification はコメントを受け付けていません

Artificial Replay: A Meta-Algorithm for Harnessing Historical Data in Bandits

要約 Banditアルゴリズムのほとんどの実際の展開は、オフラインとオンラインの … 続きを読む

カテゴリー: cs.LG, stat.ML | Artificial Replay: A Meta-Algorithm for Harnessing Historical Data in Bandits はコメントを受け付けていません

The Pitfalls of Imitation Learning when Actions are Continuous

要約 私たちは、離散時間の連続状態と行動制御システムで専門家のデモンストレーター … 続きを読む

カテゴリー: cs.LG, cs.SY, eess.SY, stat.ML | The Pitfalls of Imitation Learning when Actions are Continuous はコメントを受け付けていません

A sharp uniform-in-time error estimate for Stochastic Gradient Langevin Dynamics

要約 確率的勾配Langevin Dynamics(SGLD)の鋭い均一な時間エ … 続きを読む

カテゴリー: 60H30, 65C20, 68Q25, cs.LG, math.PR, stat.ML | A sharp uniform-in-time error estimate for Stochastic Gradient Langevin Dynamics はコメントを受け付けていません

Robustness of Nonlinear Representation Learning

要約 私たちは、わずかに誤解された設定で監視されていない表現学習の問題を研究し、 … 続きを読む

カテゴリー: cs.LG, stat.ML | Robustness of Nonlinear Representation Learning はコメントを受け付けていません