-
最近の投稿
- Enhancing Efficiency in Multidevice Federated Learning through Data Selection
- RadarTrack: Enhancing Ego-Vehicle Speed Estimation with Single-chip mmWave Radar
- HOPE: A Reinforcement Learning-based Hybrid Policy Path Planner for Diverse Parking Scenarios
- From Imitation to Exploration: End-to-end Autonomous Driving based on World Model
- LLM-Enabled In-Context Learning for Data Collection Scheduling in UAV-assisted Sensor Networks
-
最近のコメント
表示できるコメントはありません。 cs.AI (36903) cs.CL (27936) cs.CV (42678) cs.HC (2822) cs.LG (41843) cs.RO (21845) cs.SY (3324) eess.IV (4979) eess.SY (3316) stat.ML (5475)
「stat.ML」カテゴリーアーカイブ
Capturing Individual Human Preferences with Reward Features
要約 人間のフィードバックからの強化学習は通常、人々を区別しない報酬モデルを使用 … 続きを読む
Quantum Algorithms for the Pathwise Lasso
要約 古典的なLARS(最小角度回帰)経路ごとのアルゴリズムに基づいて、$ \ … 続きを読む
Sparse Nonparametric Contextual Bandits
要約 このペーパーでは、関連する機能を同時に学習し、文脈上の盗賊の問題の後悔を最 … 続きを読む
Multi-Output Distributional Fairness via Post-Processing
要約 後処理アプローチは、直感性、計算コストの低さ、優れたスケーラビリティのため … 続きを読む
Sample Efficient Preference Alignment in LLMs via Active Exploration
要約 嗜好ベースのフィードバックは、報酬機能の評価が実行不可能な機械学習における … 続きを読む
Online federated learning framework for classification
要約 このホワイトペーパーでは、データプライバシーと計算効率を確保しながら、複数 … 続きを読む
Artificial Replay: A Meta-Algorithm for Harnessing Historical Data in Bandits
要約 Banditアルゴリズムのほとんどの実際の展開は、オフラインとオンラインの … 続きを読む
The Pitfalls of Imitation Learning when Actions are Continuous
要約 私たちは、離散時間の連続状態と行動制御システムで専門家のデモンストレーター … 続きを読む
A sharp uniform-in-time error estimate for Stochastic Gradient Langevin Dynamics
要約 確率的勾配Langevin Dynamics(SGLD)の鋭い均一な時間エ … 続きを読む
Robustness of Nonlinear Representation Learning
要約 私たちは、わずかに誤解された設定で監視されていない表現学習の問題を研究し、 … 続きを読む