-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「math.OC」カテゴリーアーカイブ
Policy Gradient Methods for Discrete Time Linear Quadratic Regulator With Random Parameters
要約 本論文では,時間に対して独立かつ同次に分布するランダムなパラメータを持つ離 … 続きを読む
New Characterizations and Efficient Local Search for General Integer Linear Programming
要約 整数線形計画法(ILP)は、実用的な組合せ最適化問題を幅広くモデル化し、産 … 続きを読む
Dimensionless Policies based on the Buckingham $π$ Theorem: Is This a Good Way to Generalize Numerical Results?
要約 コンテキスト (モーション コントロールの問題を定義する変数のリスト) が … 続きを読む
Efficient Model-Free Exploration in Low-Rank MDPs
要約 強化学習における主な課題は、一般化と関数近似が必要な高次元領域を探索するた … 続きを読む
Convex Hulls of Reachable Sets
要約 我々は、境界のある外乱と不確実な初期条件を伴う、到達可能な非線形システムの … 続きを読む
Heavy-Tailed Class Imbalance and Why Adam Outperforms Gradient Descent on Language Models
要約 Adam は、大規模な言語トランスフォーマーの最適化において勾配降下法を上 … 続きを読む
Training Dynamics of Multi-Head Softmax Attention for In-Context Learning: Emergence, Convergence, and Optimality
要約 マルチタスク線形回帰のインコンテキスト学習のためのマルチヘッド ソフトマッ … 続きを読む
Taming Nonconvex Stochastic Mirror Descent with General Bregman Divergence
要約 このペーパーでは、現代の非凸最適化設定における確率的ミラー降下法 (SMD … 続きを読む
Robustly Learning Single-Index Models via Alignment Sharpness
要約 不可知論的モデルにおける $L_2^2$ 損失の下での単一インデックス モ … 続きを読む