「stat.ML」カテゴリーアーカイブ

Zero-shot Model-based Reinforcement Learning using Large Language Models

投稿日: 2024年10月16日作成者: jarxiv

要約大規模言語モデル (LLM) の新たなゼロショット機能により、自然言語処理 … 続きを読む →

カテゴリー: cs.LG, stat.ML | コメントを受け付けていません

On the Training Convergence of Transformers for In-Context Classification

投稿日: 2024年10月16日作成者: jarxiv

要約トランスフォーマーは実際にインコンテキスト学習 (ICL) の優れた能力を … 続きを読む →

カテゴリー: cs.IT, cs.LG, math.IT, stat.ML | コメントを受け付けていません

A Novel Gaussian Min-Max Theorem and its Applications

投稿日: 2024年10月16日作成者: jarxiv

要約ゴードンによる有名な結果により、特定の不等式条件が満たされた場合に 2 つ … 続きを読む →

カテゴリー: cs.LG, stat.ML | コメントを受け付けていません

Bayesian Experimental Design via Contrastive Diffusions

投稿日: 2024年10月16日作成者: jarxiv

要約ベイズ最適実験計画 (BOED) は、一連の実験の実行コストを削減する強力 … 続きを読む →

カテゴリー: cs.LG, stat.ML | コメントを受け付けていません

Mitigating Suboptimality of Deterministic Policy Gradients in Complex Q-functions

投稿日: 2024年10月16日作成者: jarxiv

要約強化学習では、DDPG や TD3 などのオフポリシーアクタークリティカ … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO, stat.ML | コメントを受け付けていません

A Simple Baseline for Predicting Events with Auto-Regressive Tabular Transformers

投稿日: 2024年10月15日作成者: jarxiv

要約表形式データの実世界のアプリケーションの多くには、履歴イベントを使用して新 … 続きを読む →

カテゴリー: cs.CE, cs.LG, stat.ML | コメントを受け付けていません

SAMPa: Sharpness-aware Minimization Parallelized

投稿日: 2024年10月15日作成者: jarxiv

要約 Sharpness-aware Minimization (SAM) はニ … 続きを読む →

カテゴリー: cs.LG, stat.ML | コメントを受け付けていません

C-Learner: Constrained Learning for Causal Inference and Semiparametric Statistics

投稿日: 2024年10月15日作成者: jarxiv

要約一般的な偏りのない因果推定手法。平均的な治療効果については、ワンステップ … 続きを読む →

カテゴリー: cs.LG, stat.ML | コメントを受け付けていません

Towards Calibrated Losses for Adversarial Robust Reject Option Classification

投稿日: 2024年10月15日作成者: jarxiv

要約敵対的な攻撃に対する堅牢性は、自動運転や医療診断などのいくつかのアプリケー … 続きを読む →

カテゴリー: cs.LG, stat.ML | コメントを受け付けていません

Online Statistical Inference for Time-varying Sample-averaged Q-learning

投稿日: 2024年10月15日作成者: jarxiv

要約強化学習 (RL) は、複雑で不確実な環境でエージェントをトレーニングする … 続きを読む →

カテゴリー: cs.IT, cs.LG, math.IT, stat.ML | コメントを受け付けていません

「stat.ML」カテゴリーアーカイブ

Zero-shot Model-based Reinforcement Learning using Large Language Models

On the Training Convergence of Transformers for In-Context Classification

A Novel Gaussian Min-Max Theorem and its Applications

Bayesian Experimental Design via Contrastive Diffusions

Mitigating Suboptimality of Deterministic Policy Gradients in Complex Q-functions

A Simple Baseline for Predicting Events with Auto-Regressive Tabular Transformers

SAMPa: Sharpness-aware Minimization Parallelized

C-Learner: Constrained Learning for Causal Inference and Semiparametric Statistics

Towards Calibrated Losses for Adversarial Robust Reject Option Classification

Online Statistical Inference for Time-varying Sample-averaged Q-learning

最近の投稿

最近のコメント

アーカイブ

カテゴリー