stat.ML」カテゴリーアーカイブ

Optimal Transport for Treatment Effect Estimation

要約 治療選択バイアスが存在するため、観察データから条件付き平均治療効果を推定す … 続きを読む

カテゴリー: cs.LG, stat.AP, stat.ML | Optimal Transport for Treatment Effect Estimation はコメントを受け付けていません

Addressing GAN Training Instabilities via Tunable Classification Losses

要約 敵対的生成ネットワーク (GAN) は、ジェネレーター (G) とディスク … 続きを読む

カテゴリー: cs.IT, cs.LG, math.IT, stat.ML | Addressing GAN Training Instabilities via Tunable Classification Losses はコメントを受け付けていません

Supervised and Penalized Baseline Correction

要約 分光測定では、吸収と散乱の寄与の混合から生じる歪んだスペクトル形状が示され … 続きを読む

カテゴリー: 15, 62, cs.LG, eess.SP, stat.ML | Supervised and Penalized Baseline Correction はコメントを受け付けていません

Semantic HELM: A Human-Readable Memory for Reinforcement Learning

要約 現実世界に導入された強化学習エージェントは、多くの場合、部分的に観測可能な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ML | Semantic HELM: A Human-Readable Memory for Reinforcement Learning はコメントを受け付けていません

Fundamental Limits of Membership Inference Attacks on Machine Learning Models

要約 メンバーシップ推論攻撃 (MIA) は、特定のデータ ポイントがトレーニン … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Fundamental Limits of Membership Inference Attacks on Machine Learning Models はコメントを受け付けていません

Tackling Heavy-Tailed Rewards in Reinforcement Learning with Function Approximation: Minimax Optimal and Instance-Dependent Regret Bounds

要約 多くの研究が、均一に制限された報酬を伴う強化学習 (RL) の効率的なアル … 続きを読む

カテゴリー: cs.AI, cs.LG, stat.ML | Tackling Heavy-Tailed Rewards in Reinforcement Learning with Function Approximation: Minimax Optimal and Instance-Dependent Regret Bounds はコメントを受け付けていません

LeanDojo: Theorem Proving with Retrieval-Augmented Language Models

要約 大規模言語モデル (LLM) は、Lean などの証明アシスタントを使用し … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.LO, stat.ML | LeanDojo: Theorem Proving with Retrieval-Augmented Language Models はコメントを受け付けていません

Algorithmic Foundations of Empirical X-risk Minimization

要約 この原稿では、{\bf empirical X-risk minimiza … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC, stat.ML | Algorithmic Foundations of Empirical X-risk Minimization はコメントを受け付けていません

Towards Understanding Sycophancy in Language Models

要約 人間のフィードバックは、AI アシスタントの微調整によく利用されます。 し … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, I.2.6, stat.ML | Towards Understanding Sycophancy in Language Models はコメントを受け付けていません

A Stability Principle for Learning under Non-Stationarity

要約 私たちは、非定常環境における統計学習のための多用途のフレームワークを開発し … 続きを読む

カテゴリー: 68T05, 90C15, cs.AI, cs.LG, math.OC, stat.ML | A Stability Principle for Learning under Non-Stationarity はコメントを受け付けていません