math.OC」カテゴリーアーカイブ

Follower Agnostic Methods for Stackelberg Games

要約 私たちは、フォロワーに依存しない方法で (おそらく複数のフォロワーを含む) … 続きを読む

カテゴリー: 91A65, cs.AI, cs.GT, math.DS, math.OC | Follower Agnostic Methods for Stackelberg Games はコメントを受け付けていません

MPOGames: Efficient Multimodal Partially Observable Dynamic Games

要約 ゲーム理論的手法は、豊富なマルチエージェント インタラクションを伴う状況で … 続きを読む

カテゴリー: cs.GT, cs.RO, math.OC | MPOGames: Efficient Multimodal Partially Observable Dynamic Games はコメントを受け付けていません

Solving Stabilize-Avoid Optimal Control via Epigraph Form and Deep Reinforcement Learning

要約 自律型ロボット システムのタスクでは、一般に、安全仕様を維持しながら、目的 … 続きを読む

カテゴリー: cs.RO, math.OC | Solving Stabilize-Avoid Optimal Control via Epigraph Form and Deep Reinforcement Learning はコメントを受け付けていません

Revisiting Subgradient Method: Complexity and Convergence Beyond Lipschitz Continuity

要約 部分勾配法は、非滑らかな最適化のための最も基本的なアルゴリズム スキームの … 続きを読む

カテゴリー: cs.LG, math.OC | Revisiting Subgradient Method: Complexity and Convergence Beyond Lipschitz Continuity はコメントを受け付けていません

Supervised Feature Compression based on Counterfactual Analysis

要約 反事実的な説明は、事後的に解釈可能な機械学習の事実上の標準になりつつありま … 続きを読む

カテゴリー: cs.LG, math.OC | Supervised Feature Compression based on Counterfactual Analysis はコメントを受け付けていません

Sophia: A Scalable Stochastic Second-order Optimizer for Language Model Pre-training

要約 言語モデルの事前トレーニングに莫大なコストがかかることを考慮すると、最適化 … 続きを読む

カテゴリー: cs.CL, cs.LG, math.OC | Sophia: A Scalable Stochastic Second-order Optimizer for Language Model Pre-training はコメントを受け付けていません

On First-Order Meta-Reinforcement Learning with Moreau Envelopes

要約 メタ強化学習 (MRL) は、新しい環境やタスクにすぐに適応できるエージェ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO, cs.SY, eess.SY, math.OC | On First-Order Meta-Reinforcement Learning with Moreau Envelopes はコメントを受け付けていません

Bandit Submodular Maximization for Multi-Robot Coordination in Unpredictable and Partially Observable Environments

要約 私たちは、予測不可能で部分的に観察可能な環境、つまり、将来の進化がアプリオ … 続きを読む

カテゴリー: cs.AI, cs.MA, cs.RO, cs.SY, eess.SY, math.OC | Bandit Submodular Maximization for Multi-Robot Coordination in Unpredictable and Partially Observable Environments はコメントを受け付けていません

End-to-End Stable Imitation Learning via Autonomous Neural Dynamic Policies

要約 最先端の感覚運動学習アルゴリズムは、不安定な動作を生成し、ロボットや環境に … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO, math.OC | End-to-End Stable Imitation Learning via Autonomous Neural Dynamic Policies はコメントを受け付けていません

Geometric Facts Underlying Algorithms of Robot Navigation for Tight Circumnavigation of Group Objects through Singular Inter-Object Gaps

要約 回転半径が低く制限された、作動が不十分な非ホロノミックなデュビン車両のよう … 続きを読む

カテゴリー: cs.RO, math.OC | Geometric Facts Underlying Algorithms of Robot Navigation for Tight Circumnavigation of Group Objects through Singular Inter-Object Gaps はコメントを受け付けていません