-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「math.OC」カテゴリーアーカイブ
Online Newton Method for Bandit Convex Optimisation
要約 ゼロ次バンディット凸最適化のための計算効率の高いアルゴリズムを導入し、敵対 … 続きを読む
Random Features Approximation for Control-Affine Systems
要約 最新のデータ駆動型制御アプリケーションには、原理に基づいたコントローラー合 … 続きを読む
Training Dynamics of Multi-Head Softmax Attention for In-Context Learning: Emergence, Convergence, and Optimality
要約 マルチタスク線形回帰のインコンテキスト学習のためのマルチヘッド ソフトマッ … 続きを読む
A Guide to Stochastic Optimisation for Large-Scale Inverse Problems
要約 確率的最適化アルゴリズムは、大量のデータを使用した機械学習の事実上の標準で … 続きを読む
Decentralized Personalized Federated Learning
要約 この研究では、分散型フェデレーテッド ラーニングにおけるデータの異質性と通 … 続きを読む
Threshold Decision-Making Dynamics Adaptive to Physical Constraints and Changing Environment
要約 我々は、2 つの空間タスク間を切り替えるエージェントの物理的ダイナミクスを … 続きを読む
Dealing with unbounded gradients in stochastic saddle-point optimization
要約 凸凹関数の鞍点を見つけるための確率的一次法の性能を研究します。 このような … 続きを読む
Gradient Descent on Logistic Regression with Non-Separable Data and Large Step Sizes
要約 私たちは、大きく一定のステップ サイズを使用したロジスティック回帰問題に関 … 続きを読む
Learning mirror maps in policy mirror descent
要約 Policy Mirror Descent (PMD) は強化学習で人気の … 続きを読む
Robust Reward Design for Markov Decision Processes
要約 報酬設計の問題では、リーダーとフォロワーの間の相互作用を調べます。リーダー … 続きを読む