-
最近の投稿
- A Systematic Approach to Design Real-World Human-in-the-Loop Deep Reinforcement Learning: Salient Features, Challenges and Trade-offs
- Robo-Troj: Attacking LLM-based Task Planners
- SE(3)-Equivariant Robot Learning and Control: A Tutorial Survey
- Geometric Formulation of Unified Force-Impedance Control on SE(3) for Robotic Manipulators
- Subframework-based Bearing Rigidity Maintenance Control in Multirobot Networks
-
最近のコメント
表示できるコメントはありません。 cs.AI (37106) cs.CL (28087) cs.CV (42847) cs.HC (2837) cs.LG (42044) cs.RO (21987) cs.SY (3355) eess.IV (4990) eess.SY (3347) stat.ML (5498)
「math.ST」カテゴリーアーカイブ
Is a Good Foundation Necessary for Efficient Reinforcement Learning? The Computational Role of the Base Model in Exploration
要約 アクティブな探査を活用する言語モデルのアライメント(または、補強学習)技術 … 続きを読む
Some Targets Are Harder to Identify than Others: Quantifying the Target-dependent Membership Leakage
要約 メンバーシップ推論(MI)ゲームでは、攻撃者がターゲットポイントがアルゴリ … 続きを読む
Learning Mixtures of Gaussians Using Diffusion Models
要約 $ k $ gausianiansの混合物を学習するための新しいアルゴリズ … 続きを読む
Optimization, Isoperimetric Inequalities, and Sampling via Lyapunov Potentials
要約 この論文では、すべての初期化からの勾配流を使用してfの最適化が、Gibbs … 続きを読む
Learning sparse generalized linear models with binary outcomes via iterative hard thresholding
要約 統計では、一般化された線形モデル(GLM)がデータのモデリングに広く使用さ … 続きを読む
Stronger Neyman Regret Guarantees for Adaptive Experimental Design
要約 設計ベースの潜在的な結果設定における、偏りのない平均治療効果(ATE)推定 … 続きを読む
An Adversarial Analysis of Thompson Sampling for Full-information Online Learning: from Finite to Infinite Action Spaces
要約 専門家の空間ではなく、敵の将来の行動の空間で学習者の事前が定義されている場 … 続きを読む
Efficient Multivariate Robust Mean Estimation Under Mean-Shift Contamination
要約 平均シフト汚染の存在下でのアイデンティティ共分散ガウスの堅牢な平均推定のア … 続きを読む
An Adversarial Analysis of Thompson Sampling for Full-information Online Learning: from Finite to Infinite Action Spaces
要約 専門家の空間ではなく、敵の将来の行動の空間で学習者の事前が定義されている場 … 続きを読む