stat.ML」カテゴリーアーカイブ

Score and Distribution Matching Policy: Advanced Accelerated Visuomotor Policies via Matched Distillation

要約 視覚運動ポリシーの学習は、複雑なロボットの軌道をモデル化することで知られる … 続きを読む

カテゴリー: cs.LG, cs.RO, stat.ML | Score and Distribution Matching Policy: Advanced Accelerated Visuomotor Policies via Matched Distillation はコメントを受け付けていません

Bayesian Optimization via Continual Variational Last Layer Training

要約 ガウス過程 (GP) は、不確実性をモデル化する能力と、相関関係が容易に把 … 続きを読む

カテゴリー: cs.LG, stat.ML | Bayesian Optimization via Continual Variational Last Layer Training はコメントを受け付けていません

Nearly Minimax Optimal Submodular Maximization with Bandit Feedback

要約 未知の単調な部分モジュラー集合関数 $f: 2^{[n]} \righta … 続きを読む

カテゴリー: cs.LG, stat.ML | Nearly Minimax Optimal Submodular Maximization with Bandit Feedback はコメントを受け付けていません

Capturing the Temporal Dependence of Training Data Influence

要約 影響関数などの従来のデータ影響推定手法では、学習アルゴリズムがトレーニング … 続きを読む

カテゴリー: cs.LG, stat.ML | Capturing the Temporal Dependence of Training Data Influence はコメントを受け付けていません

Enhancing Convergence of Decentralized Gradient Tracking under the KL Property

要約 私たちは、無向グラフとしてモデル化された、ネットワーク上の分散型マルチエー … 続きを読む

カテゴリー: cs.LG, cs.SY, eess.SY, math.OC, stat.ML | Enhancing Convergence of Decentralized Gradient Tracking under the KL Property はコメントを受け付けていません

Wait-Less Offline Tuning and Re-solving for Online Decision Making

要約 オンライン線形計画法 (OLP) は、収益管理とリソース割り当てに幅広い用 … 続きを読む

カテゴリー: cs.LG, math.OC, stat.ML | Wait-Less Offline Tuning and Re-solving for Online Decision Making はコメントを受け付けていません

Model Developmental Safety: A Retention-Centric Method and Applications in Vision-Language Models

要約 現実の世界では、学習対応システムは通常、困難なタスクや新たなタスクを処理す … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC, stat.ML | Model Developmental Safety: A Retention-Centric Method and Applications in Vision-Language Models はコメントを受け付けていません

Sail into the Headwind: Alignment via Robust Rewards and Dynamic Labels against Reward Hacking

要約 AI システムを人間の好みに合わせると、不完全な報酬モデルの最適化が望まし … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC, math.ST, stat.ML, stat.TH | Sail into the Headwind: Alignment via Robust Rewards and Dynamic Labels against Reward Hacking はコメントを受け付けていません

Continuous Multidimensional Scaling

要約 多次元スケーリング (MDS) は、$d$ 次元のユークリッド空間に $n … 続きを読む

カテゴリー: 62H99, cs.LG, stat.ML | Continuous Multidimensional Scaling はコメントを受け付けていません

Harnessing the Power of Vicinity-Informed Analysis for Classification under Covariate Shift

要約 転移学習は、ソース分布からのデータを活用することでターゲット分布の予測精度 … 続きを読む

カテゴリー: cs.LG, stat.ML | Harnessing the Power of Vicinity-Informed Analysis for Classification under Covariate Shift はコメントを受け付けていません