「math.OC」カテゴリーアーカイブ

Bridging Offline Reinforcement Learning and Imitation Learning: A Tale of Pessimism

投稿日: 2023年7月4日作成者: jarxiv

要約オフライン(またはバッチ)強化学習(RL)アルゴリズムは、能動的なデータ収 … 続きを読む →

カテゴリー: cs.AI, cs.LG, math.OC, math.ST, stat.ML, stat.TH | コメントを受け付けていません

Reinforcement Learning with Human Feedback: Learning Dynamic Choices via Pessimism

投稿日: 2023年7月4日作成者: jarxiv

要約本論文では、人間の選択によって誘発される軌道の集合から、人間の基本的な報酬 … 続きを読む →

カテゴリー: cs.AI, cs.LG, math.OC, math.ST, stat.ML, stat.TH | コメントを受け付けていません

Asynchronous and Parallel Distributed Pose Graph Optimization

投稿日: 2023年7月3日作成者: jarxiv

要約我々は、複数ロボットの同時位置特定とマッピングにおける分散ポーズグラフ最適 … 続きを読む →

カテゴリー: cs.MA, cs.RO, math.OC | コメントを受け付けていません

Screw and Lie Group Theory in Multibody Dynamics — Recursive Algorithms and Equations of Motion of Tree-Topology Systems

投稿日: 2023年7月3日作成者: jarxiv

要約ねじとリー群理論は、マルチボディシステム (MBS) の使いやすいモデリ … 続きを読む →

カテゴリー: cs.NA, cs.RO, math.DG, math.NA, math.OC | コメントを受け付けていません

Robust Implicit Regularization via Weight Normalization

投稿日: 2023年7月3日作成者: jarxiv

要約過剰パラメータ化されたモデルには多くの補間ソリューションが含まれる場合があ … 続きを読む →

カテゴリー: cs.LG, math.OC | コメントを受け付けていません

Enhancing training of physics-informed neural networks using domain-decomposition based preconditioning strategies

投稿日: 2023年7月3日作成者: jarxiv

要約私たちは、物理情報に基づいたニューラルネットワーク (PINN) のトレ … 続きを読む →

カテゴリー: 65M55, 68T07, 90C06, 90C26, 90C30, cs.LG, cs.NA, math.NA, math.OC | コメントを受け付けていません

A Gradient Smoothed Functional Algorithm with Truncated Cauchy Random Perturbations for Stochastic Optimization

投稿日: 2023年7月3日作成者: jarxiv

要約この論文では、ノイズの多いコストサンプルに対する期待値である滑らかな目的 … 続きを読む →

カテゴリー: cs.LG, math.OC | コメントを受け付けていません

GEC: A Unified Framework for Interactive Decision Making in MDP, POMDP, and Beyond

投稿日: 2023年7月3日作成者: jarxiv

要約私たちは、対話型意思決定の一般的な枠組みの下で、サンプルの効率的強化学習 … 続きを読む →

カテゴリー: cs.AI, cs.LG, math.OC, stat.ML | コメントを受け付けていません

Multiobjective Logistics Optimization for Automated ATM Cash Replenishment Process

投稿日: 2023年7月3日作成者: jarxiv

要約デジタル変革の時代では、デジタルテクノロジーを銀行業務のあらゆる側面に統合 … 続きを読む →

カテゴリー: cs.AI, math.OC | コメントを受け付けていません

Discriminatory or Samaritan — which AI is needed for humanity? An Evolutionary Game Theory Analysis of Hybrid Human-AI populations

投稿日: 2023年7月3日作成者: jarxiv

要約人工知能 (AI) システムが私たちの生活にますます組み込まれるにつれ、そ … 続きを読む →

カテゴリー: cs.AI, cs.MA, math.DS, math.OC, nlin.AO | コメントを受け付けていません

「math.OC」カテゴリーアーカイブ

Bridging Offline Reinforcement Learning and Imitation Learning: A Tale of Pessimism

Reinforcement Learning with Human Feedback: Learning Dynamic Choices via Pessimism

Asynchronous and Parallel Distributed Pose Graph Optimization

Screw and Lie Group Theory in Multibody Dynamics — Recursive Algorithms and Equations of Motion of Tree-Topology Systems

Robust Implicit Regularization via Weight Normalization

Enhancing training of physics-informed neural networks using domain-decomposition based preconditioning strategies

A Gradient Smoothed Functional Algorithm with Truncated Cauchy Random Perturbations for Stochastic Optimization

GEC: A Unified Framework for Interactive Decision Making in MDP, POMDP, and Beyond

Multiobjective Logistics Optimization for Automated ATM Cash Replenishment Process

Discriminatory or Samaritan — which AI is needed for humanity? An Evolutionary Game Theory Analysis of Hybrid Human-AI populations

最近の投稿

最近のコメント

アーカイブ

カテゴリー