-
最近の投稿
- A Systematic Approach to Design Real-World Human-in-the-Loop Deep Reinforcement Learning: Salient Features, Challenges and Trade-offs
- Robo-Troj: Attacking LLM-based Task Planners
- SE(3)-Equivariant Robot Learning and Control: A Tutorial Survey
- Geometric Formulation of Unified Force-Impedance Control on SE(3) for Robotic Manipulators
- Subframework-based Bearing Rigidity Maintenance Control in Multirobot Networks
-
最近のコメント
表示できるコメントはありません。 cs.AI (37106) cs.CL (28087) cs.CV (42847) cs.HC (2837) cs.LG (42044) cs.RO (21987) cs.SY (3355) eess.IV (4990) eess.SY (3347) stat.ML (5498)
「math.ST」カテゴリーアーカイブ
Anytime-valid t-tests and confidence sequences for Gaussian means with unknown variance
要約 1976 年に、Lai は、未知の分散 $\sigma^2$ を持つガウス … 続きを読む
DPO: Differential reinforcement learning with application to optimal configuration search
要約 連続状態およびアクション空間を使用した強化学習 (RL) は、依然としてこ … 続きを読む
Score matching for sub-Riemannian bridge sampling
要約 条件付き拡散プロセスのシミュレーションは、確率過程、データ代入、生成モデリ … 続きを読む
A Guide to Feature Importance Methods for Scientific Inference
要約 機械学習 (ML) モデルは、その高い予測能力によりますます使用されていま … 続きを読む
Precise Asymptotics for Spectral Methods in Mixed Generalized Linear Models
要約 混合一般化線形モデルの目的は、ラベルのない観測から複数の信号を学習すること … 続きを読む
Precise Asymptotics for Spectral Methods in Mixed Generalized Linear Models
要約 混合一般化線形モデルの目的は、ラベルのない観測から複数の信号を学習すること … 続きを読む
Provable Reward-Agnostic Preference-Based Reinforcement Learning
要約 好みベースの強化学習 (PbRL) は、RL エージェントが、明示的な報酬 … 続きを読む
Sliding down the stairs: how correlated latent variables accelerate learning with neural networks
要約 ニューラル ネットワークは、確率的勾配降下法 (SGD) を使用してデータ … 続きを読む
An Overview of Diffusion Models: Applications, Guided Generation, Statistical Rates and Optimization
要約 強力かつ普遍的な生成 AI テクノロジーである拡散モデルは、コンピューター … 続きを読む