-
最近の投稿
- ManipTrans: Efficient Dexterous Bimanual Manipulation Transfer via Residual Learning
- Multimodal Object Detection using Depth and Image Data for Manufacturing Parts
- Data-Agnostic Robotic Long-Horizon Manipulation with Vision-Language-Guided Closed-Loop Feedback
- Pretrained Bayesian Non-parametric Knowledge Prior in Robotic Long-Horizon Reinforcement Learning
- Bresa: Bio-inspired Reflexive Safe Reinforcement Learning for Contact-Rich Robotic Tasks
-
最近のコメント
表示できるコメントはありません。 cs.AI (35861) cs.CL (27115) cs.CR (2735) cs.CV (41715) cs.LG (40810) cs.RO (21147) cs.SY (3199) eess.IV (4903) eess.SY (3193) stat.ML (5350)
「math.PR」カテゴリーアーカイブ
Mixing Any Cocktail with Limited Ingredients: On the Structure of Payoff Sets in Multi-Objective MDPs and its Impact on Randomised Strategies
要約 マルコフの決定プロセスにおける多次元ペイオフ関数を検討し、特定の予想ペイオ … 続きを読む
Score Change of Variables
要約 スコア関数の変数式の一般的な変更を導き出します。スムーズで反転可能な変換$ … 続きを読む
Selective Reviews of Bandit Problems in AI via a Statistical View
要約 Rehnection Learning(RL)は、環境との相互作用を通じて … 続きを読む
Selective Reviews of Bandit Problems in AI via a Statistical View
要約 Rehnection Learning(RL)は、環境との相互作用を通じて … 続きを読む
Rough Stochastic Pontryagin Maximum Principle and an Indirect Shooting Method
要約 ガウスのラフパスによって駆動される粗微分方程式(RDE)によってモデル化さ … 続きを読む
Gaussian Approximation and Multiplier Bootstrap for Stochastic Gradient Descent
要約 この論文では、確率的勾配降下(SGD)のPolyAK-Ruppert平均繰 … 続きを読む
Noise Sensitivity of Hierarchical Functions and Deep Learning Lower Bounds in General Product Measures
要約 最近の作品は、階層構造を使用した機能またはデータを調べることにより、Dee … 続きを読む
Student-t processes as infinite-width limits of posterior Bayesian neural networks
要約 ベイジアンニューラルネットワーク(BNNS)の漸近特性は、特に無限の幅の制 … 続きを読む
Statistical guarantees for continuous-time policy evaluation: blessing of ellipticity and new tradeoffs
要約 単一の個別に観察されたエルゴジック軌道を使用して、連続時間マルコフ拡散プロ … 続きを読む
The Uniformly Rotated Mondrian Kernel
要約 RahimiとRechtによって最初に提案されたランダム機能は、大規模な問 … 続きを読む