「math.OC」カテゴリーアーカイブ

Online Newton Method for Bandit Convex Optimisation

投稿日: 2024年6月11日作成者: jarxiv

要約ゼロ次バンディット凸最適化のための計算効率の高いアルゴリズムを導入し、敵対 … 続きを読む →

カテゴリー: cs.LG, math.OC, stat.ML | コメントを受け付けていません

Random Features Approximation for Control-Affine Systems

投稿日: 2024年6月11日作成者: jarxiv

要約最新のデータ駆動型制御アプリケーションには、原理に基づいたコントローラー合 … 続きを読む →

カテゴリー: cs.LG, cs.SY, eess.SY, math.OC, stat.ML | コメントを受け付けていません

Training Dynamics of Multi-Head Softmax Attention for In-Context Learning: Emergence, Convergence, and Optimality

投稿日: 2024年6月11日作成者: jarxiv

要約マルチタスク線形回帰のインコンテキスト学習のためのマルチヘッドソフトマッ … 続きを読む →

カテゴリー: cs.AI, cs.LG, math.OC, math.ST, stat.ML, stat.TH | コメントを受け付けていません

A Guide to Stochastic Optimisation for Large-Scale Inverse Problems

投稿日: 2024年6月11日作成者: jarxiv

要約確率的最適化アルゴリズムは、大量のデータを使用した機械学習の事実上の標準で … 続きを読む →

カテゴリー: cs.CV, cs.NA, math.NA, math.OC | コメントを受け付けていません

Decentralized Personalized Federated Learning

投稿日: 2024年6月11日作成者: jarxiv

要約この研究では、分散型フェデレーテッドラーニングにおけるデータの異質性と通 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MA, math.OC | コメントを受け付けていません

Threshold Decision-Making Dynamics Adaptive to Physical Constraints and Changing Environment

投稿日: 2024年6月10日作成者: jarxiv

要約我々は、2 つの空間タスク間を切り替えるエージェントの物理的ダイナミクスを … 続きを読む →

カテゴリー: cs.RO, math.DS, math.OC | コメントを受け付けていません

Dealing with unbounded gradients in stochastic saddle-point optimization

投稿日: 2024年6月10日作成者: jarxiv

要約凸凹関数の鞍点を見つけるための確率的一次法の性能を研究します。このような … 続きを読む →

カテゴリー: cs.LG, math.OC, stat.ML | コメントを受け付けていません

Gradient Descent on Logistic Regression with Non-Separable Data and Large Step Sizes

投稿日: 2024年6月10日作成者: jarxiv

要約私たちは、大きく一定のステップサイズを使用したロジスティック回帰問題に関 … 続きを読む →

カテゴリー: cs.LG, math.OC | コメントを受け付けていません

Learning mirror maps in policy mirror descent

投稿日: 2024年6月10日作成者: jarxiv

要約 Policy Mirror Descent (PMD) は強化学習で人気の … 続きを読む →

カテゴリー: cs.LG, math.OC, stat.ML | コメントを受け付けていません

Robust Reward Design for Markov Decision Processes

投稿日: 2024年6月10日作成者: jarxiv

要約報酬設計の問題では、リーダーとフォロワーの間の相互作用を調べます。リーダー … 続きを読む →

カテゴリー: cs.AI, cs.GT, math.OC | コメントを受け付けていません

「math.OC」カテゴリーアーカイブ

Online Newton Method for Bandit Convex Optimisation

Random Features Approximation for Control-Affine Systems

Training Dynamics of Multi-Head Softmax Attention for In-Context Learning: Emergence, Convergence, and Optimality

A Guide to Stochastic Optimisation for Large-Scale Inverse Problems

Decentralized Personalized Federated Learning

Threshold Decision-Making Dynamics Adaptive to Physical Constraints and Changing Environment

Dealing with unbounded gradients in stochastic saddle-point optimization

Gradient Descent on Logistic Regression with Non-Separable Data and Large Step Sizes

Learning mirror maps in policy mirror descent

Robust Reward Design for Markov Decision Processes

最近の投稿

最近のコメント

アーカイブ

カテゴリー