math.OC」カテゴリーアーカイブ

$ε$-Policy Gradient for Online Pricing

要約 本稿では、モデルベースとモデルフリーの強化学習アプローチを組み合わせて、オ … 続きを読む

カテゴリー: 62J12, 65Y20, 68Q32, cs.LG, math.OC, q-fin.ST, stat.ML | $ε$-Policy Gradient for Online Pricing はコメントを受け付けていません

Regularized Q-learning through Robust Averaging

要約 我々は、2RA Q-learningと呼ばれる新しいQ-learningの … 続きを読む

カテゴリー: cs.LG, math.OC | Regularized Q-learning through Robust Averaging はコメントを受け付けていません

Zero-Sum Positional Differential Games as a Framework for Robust Reinforcement Learning: Deep Q-Learning Approach

要約 ロバスト強化学習(RRL)は、不確実性や擾乱に対してロバストなモデルを学習 … 続きを読む

カテゴリー: 49N70, 68T07, cs.AI, cs.GT, cs.LG, cs.SY, eess.SY, math.OC | Zero-Sum Positional Differential Games as a Framework for Robust Reinforcement Learning: Deep Q-Learning Approach はコメントを受け付けていません

A Convex Formulation of the Soft-Capture Problem

要約 非協力的なタンブリング空間オブジェクトをソフトにキャプチャするための高速軌 … 続きを読む

カテゴリー: cs.RO, cs.SY, eess.SY, math.OC | A Convex Formulation of the Soft-Capture Problem はコメントを受け付けていません

On Semidefinite Relaxations for Matrix-Weighted State-Estimation Problems in Robotics

要約 近年、ロボット工学における知覚問題の大域最適を見つけるために半明確な凸緩和 … 続きを読む

カテゴリー: cs.RO, math.OC | On Semidefinite Relaxations for Matrix-Weighted State-Estimation Problems in Robotics はコメントを受け付けていません

Adaptive Federated Learning with Auto-Tuned Clients

要約 フェデレーテッド ラーニング (FL) は、分散型機械学習フレームワークで … 続きを読む

カテゴリー: cs.DC, cs.LG, math.OC | Adaptive Federated Learning with Auto-Tuned Clients はコメントを受け付けていません

Random Pareto front surfaces

要約 ベクトルのセットのパレート フロントは、すべての最良のトレードオフ ポイン … 続きを読む

カテゴリー: cs.LG, math.OC, stat.ME, stat.ML | Random Pareto front surfaces はコメントを受け付けていません

Common pitfalls to avoid while using multiobjective optimization in machine learning

要約 最近、機械学習 (ML) における多目的最適化 (MOO) の応用の探索に … 続きを読む

カテゴリー: cs.LG, math.OC | Common pitfalls to avoid while using multiobjective optimization in machine learning はコメントを受け付けていません

Boosting Jailbreak Attack with Momentum

要約 大規模言語モデル (LLM) は、さまざまなタスクにわたって目覚ましい成功 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG, math.OC | Boosting Jailbreak Attack with Momentum はコメントを受け付けていません

Multi-objective optimisation via the R2 utilities

要約 複数の目的の最適化の目標は、複数の目的間の可能な限り最良のトレードオフを表 … 続きを読む

カテゴリー: cs.LG, math.OC, stat.ML | Multi-objective optimisation via the R2 utilities はコメントを受け付けていません