stat.ML」カテゴリーアーカイブ

Zero-shot Model-based Reinforcement Learning using Large Language Models

要約 大規模言語モデル (LLM) の新たなゼロショット機能により、自然言語処理 … 続きを読む

カテゴリー: cs.LG, stat.ML | Zero-shot Model-based Reinforcement Learning using Large Language Models はコメントを受け付けていません

On the Training Convergence of Transformers for In-Context Classification

要約 トランスフォーマーは実際にインコンテキスト学習 (ICL) の優れた能力を … 続きを読む

カテゴリー: cs.IT, cs.LG, math.IT, stat.ML | On the Training Convergence of Transformers for In-Context Classification はコメントを受け付けていません

A Novel Gaussian Min-Max Theorem and its Applications

要約 ゴードンによる有名な結果により、特定の不等式条件が満たされた場合に 2 つ … 続きを読む

カテゴリー: cs.LG, stat.ML | A Novel Gaussian Min-Max Theorem and its Applications はコメントを受け付けていません

Bayesian Experimental Design via Contrastive Diffusions

要約 ベイズ最適実験計画 (BOED) は、一連の実験の実行コストを削減する強力 … 続きを読む

カテゴリー: cs.LG, stat.ML | Bayesian Experimental Design via Contrastive Diffusions はコメントを受け付けていません

Mitigating Suboptimality of Deterministic Policy Gradients in Complex Q-functions

要約 強化学習では、DDPG や TD3 などのオフポリシー アクタークリティカ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO, stat.ML | Mitigating Suboptimality of Deterministic Policy Gradients in Complex Q-functions はコメントを受け付けていません

A Simple Baseline for Predicting Events with Auto-Regressive Tabular Transformers

要約 表形式データの実世界のアプリケーションの多くには、履歴イベントを使用して新 … 続きを読む

カテゴリー: cs.CE, cs.LG, stat.ML | A Simple Baseline for Predicting Events with Auto-Regressive Tabular Transformers はコメントを受け付けていません

SAMPa: Sharpness-aware Minimization Parallelized

要約 Sharpness-aware Minimization (SAM) はニ … 続きを読む

カテゴリー: cs.LG, stat.ML | SAMPa: Sharpness-aware Minimization Parallelized はコメントを受け付けていません

C-Learner: Constrained Learning for Causal Inference and Semiparametric Statistics

要約 一般的な偏りのない因果推定手法。 平均的な治療効果については、ワンステップ … 続きを読む

カテゴリー: cs.LG, stat.ML | C-Learner: Constrained Learning for Causal Inference and Semiparametric Statistics はコメントを受け付けていません

Towards Calibrated Losses for Adversarial Robust Reject Option Classification

要約 敵対的な攻撃に対する堅牢性は、自動運転や医療診断などのいくつかのアプリケー … 続きを読む

カテゴリー: cs.LG, stat.ML | Towards Calibrated Losses for Adversarial Robust Reject Option Classification はコメントを受け付けていません

Online Statistical Inference for Time-varying Sample-averaged Q-learning

要約 強化学習 (RL) は、複雑で不確実な環境でエージェントをトレーニングする … 続きを読む

カテゴリー: cs.IT, cs.LG, math.IT, stat.ML | Online Statistical Inference for Time-varying Sample-averaged Q-learning はコメントを受け付けていません