「stat.ML」カテゴリーアーカイブ

Score and Distribution Matching Policy: Advanced Accelerated Visuomotor Policies via Matched Distillation

投稿日: 2024年12月13日作成者: jarxiv

要約視覚運動ポリシーの学習は、複雑なロボットの軌道をモデル化することで知られる … 続きを読む →

カテゴリー: cs.LG, cs.RO, stat.ML | コメントを受け付けていません

Bayesian Optimization via Continual Variational Last Layer Training

投稿日: 2024年12月13日作成者: jarxiv

要約ガウス過程 (GP) は、不確実性をモデル化する能力と、相関関係が容易に把 … 続きを読む →

カテゴリー: cs.LG, stat.ML | コメントを受け付けていません

Nearly Minimax Optimal Submodular Maximization with Bandit Feedback

投稿日: 2024年12月13日作成者: jarxiv

要約未知の単調な部分モジュラー集合関数 $f: 2^{[n]} \righta … 続きを読む →

カテゴリー: cs.LG, stat.ML | コメントを受け付けていません

Capturing the Temporal Dependence of Training Data Influence

投稿日: 2024年12月13日作成者: jarxiv

要約影響関数などの従来のデータ影響推定手法では、学習アルゴリズムがトレーニング … 続きを読む →

カテゴリー: cs.LG, stat.ML | コメントを受け付けていません

Enhancing Convergence of Decentralized Gradient Tracking under the KL Property

投稿日: 2024年12月13日作成者: jarxiv

要約私たちは、無向グラフとしてモデル化された、ネットワーク上の分散型マルチエー … 続きを読む →

カテゴリー: cs.LG, cs.SY, eess.SY, math.OC, stat.ML | コメントを受け付けていません

Wait-Less Offline Tuning and Re-solving for Online Decision Making

投稿日: 2024年12月13日作成者: jarxiv

要約オンライン線形計画法 (OLP) は、収益管理とリソース割り当てに幅広い用 … 続きを読む →

カテゴリー: cs.LG, math.OC, stat.ML | コメントを受け付けていません

Model Developmental Safety: A Retention-Centric Method and Applications in Vision-Language Models

投稿日: 2024年12月13日作成者: jarxiv

要約現実の世界では、学習対応システムは通常、困難なタスクや新たなタスクを処理す … 続きを読む →

カテゴリー: cs.AI, cs.LG, math.OC, stat.ML | コメントを受け付けていません

Sail into the Headwind: Alignment via Robust Rewards and Dynamic Labels against Reward Hacking

投稿日: 2024年12月13日作成者: jarxiv

要約 AI システムを人間の好みに合わせると、不完全な報酬モデルの最適化が望まし … 続きを読む →

カテゴリー: cs.AI, cs.LG, math.OC, math.ST, stat.ML, stat.TH | コメントを受け付けていません

Continuous Multidimensional Scaling

投稿日: 2024年12月12日作成者: jarxiv

要約多次元スケーリング (MDS) は、$d$ 次元のユークリッド空間に $n … 続きを読む →

カテゴリー: 62H99, cs.LG, stat.ML | コメントを受け付けていません

Harnessing the Power of Vicinity-Informed Analysis for Classification under Covariate Shift

投稿日: 2024年12月12日作成者: jarxiv

要約転移学習は、ソース分布からのデータを活用することでターゲット分布の予測精度 … 続きを読む →

カテゴリー: cs.LG, stat.ML | コメントを受け付けていません

「stat.ML」カテゴリーアーカイブ

Score and Distribution Matching Policy: Advanced Accelerated Visuomotor Policies via Matched Distillation

Bayesian Optimization via Continual Variational Last Layer Training

Nearly Minimax Optimal Submodular Maximization with Bandit Feedback

Capturing the Temporal Dependence of Training Data Influence

Enhancing Convergence of Decentralized Gradient Tracking under the KL Property

Wait-Less Offline Tuning and Re-solving for Online Decision Making

Model Developmental Safety: A Retention-Centric Method and Applications in Vision-Language Models

Sail into the Headwind: Alignment via Robust Rewards and Dynamic Labels against Reward Hacking

Continuous Multidimensional Scaling

Harnessing the Power of Vicinity-Informed Analysis for Classification under Covariate Shift

最近の投稿

最近のコメント

アーカイブ

カテゴリー