-
最近の投稿
- TROVE: A Challenge for Fine-Grained Text Provenance via Source Sentence Tracing and Relationship Classification
- Cognitive Memory in Large Language Models
- Inference-Time Scaling for Generalist Reward Modeling
- ZClip: Adaptive Spike Mitigation for LLM Pre-Training
- UNDO: Understanding Distillation as Optimization
-
最近のコメント
表示できるコメントはありません。 cs.AI (36104) cs.CL (27314) cs.CR (2748) cs.CV (41948) cs.LG (41059) cs.RO (21304) cs.SY (3219) eess.IV (4920) eess.SY (3213) stat.ML (5378)
「math.ST」カテゴリーアーカイブ
Bridging Offline Reinforcement Learning and Imitation Learning: A Tale of Pessimism
要約 オフライン(またはバッチ)強化学習(RL)アルゴリズムは、能動的なデータ収 … 続きを読む
Reinforcement Learning with Human Feedback: Learning Dynamic Choices via Pessimism
要約 本論文では、人間の選択によって誘発される軌道の集合から、人間の基本的な報酬 … 続きを読む
Local Risk Bounds for Statistical Aggregation
要約 集計の問題では、基本予測子の特定のクラスを組み合わせて、最良の予測値とほぼ … 続きを読む
Mathematical Foundations for a Compositional Account of the Bayesian Brain
要約 この論文は、能動推論とベイジアン脳の構成的説明に向けたいくつかの最初のステ … 続きを読む
Gaussian random field approximation via Stein’s method with applications to wide random neural networks
要約 $n$-sphere とガウス分布によってインデックス付けされた任意の連続 … 続きを読む
Support Vector Regression: Risk Quadrangle Framework
要約 この論文では、最適化、リスク管理、統計的推定を結び付ける基本的なリスク四角 … 続きを読む
Information-Computation Tradeoffs for Learning Margin Halfspaces with Random Classification Noise
要約 ランダム分類ノイズを使用して $\gamma$-margin 半空間を学習 … 続きを読む
About the Cost of Global Privacy in Density Estimation
要約 私たちは、リプシッツ空間とソボレフ空間における、グローバルプライバシーの下 … 続きを読む
Necessary and sufficient graphical conditions for optimal adjustment sets in causal graphical models with hidden variables
要約 隠れ変数と条件付き変数を含むグラフィカル モデルの因果効果を推定するための … 続きを読む