「math.OC」カテゴリーアーカイブ

Follower Agnostic Methods for Stackelberg Games

投稿日: 2023年5月25日作成者: jarxiv

要約私たちは、フォロワーに依存しない方法で (おそらく複数のフォロワーを含む) … 続きを読む →

カテゴリー: 91A65, cs.AI, cs.GT, math.DS, math.OC | コメントを受け付けていません

MPOGames: Efficient Multimodal Partially Observable Dynamic Games

投稿日: 2023年5月24日作成者: jarxiv

要約ゲーム理論的手法は、豊富なマルチエージェントインタラクションを伴う状況で … 続きを読む →

カテゴリー: cs.GT, cs.RO, math.OC | コメントを受け付けていません

Solving Stabilize-Avoid Optimal Control via Epigraph Form and Deep Reinforcement Learning

投稿日: 2023年5月24日作成者: jarxiv

要約自律型ロボットシステムのタスクでは、一般に、安全仕様を維持しながら、目的 … 続きを読む →

カテゴリー: cs.RO, math.OC | コメントを受け付けていません

Revisiting Subgradient Method: Complexity and Convergence Beyond Lipschitz Continuity

投稿日: 2023年5月24日作成者: jarxiv

要約部分勾配法は、非滑らかな最適化のための最も基本的なアルゴリズムスキームの … 続きを読む →

カテゴリー: cs.LG, math.OC | コメントを受け付けていません

Supervised Feature Compression based on Counterfactual Analysis

投稿日: 2023年5月24日作成者: jarxiv

要約反事実的な説明は、事後的に解釈可能な機械学習の事実上の標準になりつつありま … 続きを読む →

カテゴリー: cs.LG, math.OC | コメントを受け付けていません

Sophia: A Scalable Stochastic Second-order Optimizer for Language Model Pre-training

投稿日: 2023年5月24日作成者: jarxiv

要約言語モデルの事前トレーニングに莫大なコストがかかることを考慮すると、最適化 … 続きを読む →

カテゴリー: cs.CL, cs.LG, math.OC | コメントを受け付けていません

On First-Order Meta-Reinforcement Learning with Moreau Envelopes

投稿日: 2023年5月23日作成者: jarxiv

要約メタ強化学習 (MRL) は、新しい環境やタスクにすぐに適応できるエージェ … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO, cs.SY, eess.SY, math.OC | コメントを受け付けていません

Bandit Submodular Maximization for Multi-Robot Coordination in Unpredictable and Partially Observable Environments

投稿日: 2023年5月23日作成者: jarxiv

要約私たちは、予測不可能で部分的に観察可能な環境、つまり、将来の進化がアプリオ … 続きを読む →

カテゴリー: cs.AI, cs.MA, cs.RO, cs.SY, eess.SY, math.OC | コメントを受け付けていません

End-to-End Stable Imitation Learning via Autonomous Neural Dynamic Policies

投稿日: 2023年5月23日作成者: jarxiv

要約最先端の感覚運動学習アルゴリズムは、不安定な動作を生成し、ロボットや環境に … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO, math.OC | コメントを受け付けていません

Geometric Facts Underlying Algorithms of Robot Navigation for Tight Circumnavigation of Group Objects through Singular Inter-Object Gaps

投稿日: 2023年5月23日作成者: jarxiv

要約回転半径が低く制限された、作動が不十分な非ホロノミックなデュビン車両のよう … 続きを読む →

カテゴリー: cs.RO, math.OC | コメントを受け付けていません

「math.OC」カテゴリーアーカイブ

Follower Agnostic Methods for Stackelberg Games

MPOGames: Efficient Multimodal Partially Observable Dynamic Games

Solving Stabilize-Avoid Optimal Control via Epigraph Form and Deep Reinforcement Learning

Revisiting Subgradient Method: Complexity and Convergence Beyond Lipschitz Continuity

Supervised Feature Compression based on Counterfactual Analysis

Sophia: A Scalable Stochastic Second-order Optimizer for Language Model Pre-training

On First-Order Meta-Reinforcement Learning with Moreau Envelopes

Bandit Submodular Maximization for Multi-Robot Coordination in Unpredictable and Partially Observable Environments

End-to-End Stable Imitation Learning via Autonomous Neural Dynamic Policies

Geometric Facts Underlying Algorithms of Robot Navigation for Tight Circumnavigation of Group Objects through Singular Inter-Object Gaps

最近の投稿

最近のコメント

アーカイブ

カテゴリー