-
最近の投稿
- A Systematic Approach to Design Real-World Human-in-the-Loop Deep Reinforcement Learning: Salient Features, Challenges and Trade-offs
- Robo-Troj: Attacking LLM-based Task Planners
- SE(3)-Equivariant Robot Learning and Control: A Tutorial Survey
- Geometric Formulation of Unified Force-Impedance Control on SE(3) for Robotic Manipulators
- Subframework-based Bearing Rigidity Maintenance Control in Multirobot Networks
-
最近のコメント
表示できるコメントはありません。 cs.AI (37106) cs.CL (28087) cs.CV (42847) cs.HC (2837) cs.LG (42044) cs.RO (21987) cs.SY (3355) eess.IV (4990) eess.SY (3347) stat.ML (5498)
「math.ST」カテゴリーアーカイブ
Actions Speak What You Want: Provably Sample-Efficient Reinforcement Learning of the Quantal Stackelberg Equilibrium from Strategic Feedbacks
要約 私たちは、リーダーとフォロワーの構造を持つエピソード的なマルコフ ゲームで … 続きを読む
Reinterpreting survival analysis in the universal approximator age
要約 生存分析は統計ツールボックスに不可欠な部分です。 ただし、古典的な統計のほ … 続きを読む
Efficiently Learning One-Hidden-Layer ReLU Networks via Schur Polynomials
要約 二乗損失に関して $\mathbb{R}^d$ 上の標準ガウス分布の下で … 続きを読む
Nonparametric Linear Feature Learning in Regression Through Regularisation
要約 表現学習は、特にノンパラメトリック手法では困難が多い高次元データのコンテキ … 続きを読む
Efficiently Learning One-Hidden-Layer ReLU Networks via Schur Polynomials
要約 二乗損失に関して $\mathbb{R}^d$ 上の標準ガウス分布の下で … 続きを読む
Provable Benefits of Policy Learning from Human Preferences in Contextual Bandit Problems
要約 意思決定の問題における重要なタスクは、報酬エンジニアリングです。 実際には … 続きを読む
Nonparametric Linear Feature Learning in Regression Through Regularisation
要約 表現学習は、特にノンパラメトリック手法では困難が多い高次元データのコンテキ … 続きを読む
Bayesian taut splines for estimating the number of modes
要約 確率密度関数のモードの数はモデルの複雑さを表し、既存の部分母集団の数とみな … 続きを読む
Sequential Kernelized Independence Testing
要約 独立性テストは、データを収集する前にサンプル サイズを固定するバッチ設定で … 続きを読む