math.OC」カテゴリーアーカイブ

A Dynamic Safety Shield for Safe and Efficient Reinforcement Learning of Navigation Tasks

要約 Rehnection Learning(RL)は、さまざまなロボットアプリ … 続きを読む

カテゴリー: cs.RO, math.OC | コメントする

Efficient algorithms for the Hadamard decomposition

要約 Hadamard分解は、データ分析とマトリックス圧縮の強力な手法であり、特 … 続きを読む

カテゴリー: cs.LG, eess.SP, math.OC, stat.ML | コメントする

Algorithms for mean-field variational inference via polyhedral optimization in the Wasserstein space

要約 ワッサースタイン空間を介して有限次元の多面体サブセットの理論を開発し、一次 … 続きを読む

カテゴリー: cs.LG, math.OC, math.ST, stat.TH | コメントする

Unsupervised Machine Learning Hybrid Approach Integrating Linear Programming in Loss Function: A Robust Optimization Technique

要約 このペーパーでは、監視されていない機械学習モデルの損失関数に線形プログラミ … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC | コメントする

A New Semidefinite Relaxation for Linear and Piecewise-Affine Optimal Control with Time Scaling

要約 時間スケーリングを伴う線形システムの最適な制御のために、半微細緩和を導入し … 続きを読む

カテゴリー: cs.RO, cs.SY, eess.SY, math.OC | コメントする

Cluster-based classification with neural ODEs via control

要約 $ n $のデータポイントの同時制御の観点から、神経の通常の微分方程式を使 … 続きを読む

カテゴリー: (Primary), 34H05, 68T07, cs.LG, math.OC | コメントする

MALADY: Multiclass Active Learning with Auction Dynamics on Graphs

要約 アクティブ学習は、基礎となる分類器のパフォーマンスを改善することを目的とし … 続きを読む

カテゴリー: cs.GT, cs.LG, math.OC | コメントする

Future Aware Safe Active Learning of Time Varying Systems using Gaussian Processes

要約 エンジニアリングアプリケーションで一般的な安全上の制約を伴う高コストシステ … 続きを読む

カテゴリー: cs.AI, cs.LG, G.3, math.OC, math.PR | コメントする

Score as Action: Fine-Tuning Diffusion Generative Models by Continuous-time Reinforcement Learning

要約 拡散モデルを入力プロンプトに合わせる人間のフィードバック(RLHF)からの … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC | コメントする

Optimizing LLM Inference: Fluid-Guided Online Scheduling with Memory Constraints

要約 大規模な言語モデル(LLM)は今日のアプリケーションでは不可欠ですが、それ … 続きを読む

カテゴリー: cs.AI, cs.DC, cs.LG, math.OC, stat.ML | コメントする