math.OC」カテゴリーアーカイブ

Bridging Offline Reinforcement Learning and Imitation Learning: A Tale of Pessimism

要約 オフライン(またはバッチ)強化学習(RL)アルゴリズムは、能動的なデータ収 … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC, math.ST, stat.ML, stat.TH | Bridging Offline Reinforcement Learning and Imitation Learning: A Tale of Pessimism はコメントを受け付けていません

Reinforcement Learning with Human Feedback: Learning Dynamic Choices via Pessimism

要約 本論文では、人間の選択によって誘発される軌道の集合から、人間の基本的な報酬 … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC, math.ST, stat.ML, stat.TH | Reinforcement Learning with Human Feedback: Learning Dynamic Choices via Pessimism はコメントを受け付けていません

Asynchronous and Parallel Distributed Pose Graph Optimization

要約 我々は、複数ロボットの同時位置特定とマッピングにおける分散ポーズグラフ最適 … 続きを読む

カテゴリー: cs.MA, cs.RO, math.OC | Asynchronous and Parallel Distributed Pose Graph Optimization はコメントを受け付けていません

Screw and Lie Group Theory in Multibody Dynamics — Recursive Algorithms and Equations of Motion of Tree-Topology Systems

要約 ねじとリー群理論は、マルチボディ システム (MBS) の使いやすいモデリ … 続きを読む

カテゴリー: cs.NA, cs.RO, math.DG, math.NA, math.OC | Screw and Lie Group Theory in Multibody Dynamics — Recursive Algorithms and Equations of Motion of Tree-Topology Systems はコメントを受け付けていません

Robust Implicit Regularization via Weight Normalization

要約 過剰パラメータ化されたモデルには多くの補間ソリューションが含まれる場合があ … 続きを読む

カテゴリー: cs.LG, math.OC | Robust Implicit Regularization via Weight Normalization はコメントを受け付けていません

Enhancing training of physics-informed neural networks using domain-decomposition based preconditioning strategies

要約 私たちは、物理情報に基づいたニューラル ネットワーク (PINN) のトレ … 続きを読む

カテゴリー: 65M55, 68T07, 90C06, 90C26, 90C30, cs.LG, cs.NA, math.NA, math.OC | Enhancing training of physics-informed neural networks using domain-decomposition based preconditioning strategies はコメントを受け付けていません

A Gradient Smoothed Functional Algorithm with Truncated Cauchy Random Perturbations for Stochastic Optimization

要約 この論文では、ノイズの多いコスト サンプルに対する期待値である滑らかな目的 … 続きを読む

カテゴリー: cs.LG, math.OC | A Gradient Smoothed Functional Algorithm with Truncated Cauchy Random Perturbations for Stochastic Optimization はコメントを受け付けていません

GEC: A Unified Framework for Interactive Decision Making in MDP, POMDP, and Beyond

要約 私たちは、対話型意思決定の一般的な枠組みの下で、サンプルの効率的強化学習 … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC, stat.ML | GEC: A Unified Framework for Interactive Decision Making in MDP, POMDP, and Beyond はコメントを受け付けていません

Multiobjective Logistics Optimization for Automated ATM Cash Replenishment Process

要約 デジタル変革の時代では、デジタルテクノロジーを銀行業務のあらゆる側面に統合 … 続きを読む

カテゴリー: cs.AI, math.OC | Multiobjective Logistics Optimization for Automated ATM Cash Replenishment Process はコメントを受け付けていません

Discriminatory or Samaritan — which AI is needed for humanity? An Evolutionary Game Theory Analysis of Hybrid Human-AI populations

要約 人工知能 (AI) システムが私たちの生活にますます組み込まれるにつれ、そ … 続きを読む

カテゴリー: cs.AI, cs.MA, math.DS, math.OC, nlin.AO | Discriminatory or Samaritan — which AI is needed for humanity? An Evolutionary Game Theory Analysis of Hybrid Human-AI populations はコメントを受け付けていません