stat.ML」カテゴリーアーカイブ

The Pitfalls of Imitation Learning when Actions are Continuous

要約 私たちは、離散時間の連続状態と行動制御システムで専門家のデモンストレーター … 続きを読む

カテゴリー: cs.LG, cs.SY, eess.SY, stat.ML | The Pitfalls of Imitation Learning when Actions are Continuous はコメントを受け付けていません

A sharp uniform-in-time error estimate for Stochastic Gradient Langevin Dynamics

要約 確率的勾配Langevin Dynamics(SGLD)の鋭い均一な時間エ … 続きを読む

カテゴリー: 60H30, 65C20, 68Q25, cs.LG, math.PR, stat.ML | A sharp uniform-in-time error estimate for Stochastic Gradient Langevin Dynamics はコメントを受け付けていません

Robustness of Nonlinear Representation Learning

要約 私たちは、わずかに誤解された設定で監視されていない表現学習の問題を研究し、 … 続きを読む

カテゴリー: cs.LG, stat.ML | Robustness of Nonlinear Representation Learning はコメントを受け付けていません

Weighted-Sum of Gaussian Process Latent Variable Models

要約 この作業は、信号が潜在変数によって異なる場合がある信号分離に対するベイジア … 続きを読む

カテゴリー: cs.LG, stat.ML | Weighted-Sum of Gaussian Process Latent Variable Models はコメントを受け付けていません

Sample Efficient Reinforcement Learning from Human Feedback via Active Exploration

要約 嗜好ベースのフィードバックは、報酬機能の評価が実行不可能な機械学習における … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Sample Efficient Reinforcement Learning from Human Feedback via Active Exploration はコメントを受け付けていません

What Makes a Reward Model a Good Teacher? An Optimization Perspective

要約 人間のフィードバック(RLHF)からの強化学習の成功は、報酬モデルの品質に … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | What Makes a Reward Model a Good Teacher? An Optimization Perspective はコメントを受け付けていません

Optimizing High-Dimensional Oblique Splits

要約 直交するスプリットの木はうまく機能しますが、証拠は、斜めの分裂がパフォーマ … 続きを読む

カテゴリー: cs.LG, math.ST, stat.ME, stat.ML, stat.TH | Optimizing High-Dimensional Oblique Splits はコメントを受け付けていません

Landscape Complexity for the Empirical Risk of Generalized Linear Models: Discrimination between Structured Data

要約 KACライス式とランダムマトリックス理論の結果を使用して、高次元の経験的損 … 続きを読む

カテゴリー: cond-mat.stat-mech, cs.LG, stat.ML | Landscape Complexity for the Empirical Risk of Generalized Linear Models: Discrimination between Structured Data はコメントを受け付けていません

Online Conformal Probabilistic Numerics via Adaptive Edge-Cloud Offloading

要約 リニアシステムのソリューションのクエリをエッジプロセッサに送信するエッジコ … 続きを読む

カテゴリー: cs.LG, stat.ML | Online Conformal Probabilistic Numerics via Adaptive Edge-Cloud Offloading はコメントを受け付けていません

Doubly robust identification of treatment effects from multiple environments

要約 実用的および倫理的な制約では、多くの場合、特に医学と社会科学において、因果 … 続きを読む

カテゴリー: cs.LG, stat.ME, stat.ML | Doubly robust identification of treatment effects from multiple environments はコメントを受け付けていません