-
最近の投稿
- FEAST: A Flexible Mealtime-Assistance System Towards In-the-Wild Personalization
- Time-Optimized Safe Navigation in Unstructured Environments through Learning Based Depth Completion
- Advances in Compliance Detection: Novel Models Using Vision-Based Tactile Sensors
- Mass-Adaptive Admittance Control for Robotic Manipulators
- DreamGen: Unlocking Generalization in Robot Learning through Video World Models
-
最近のコメント
表示できるコメントはありません。 cs.AI (39879) cs.CL (30187) cs.CV (45175) cs.HC (3051) cs.LG (44808) cs.RO (23879) cs.SY (3632) eess.IV (5170) eess.SY (3624) stat.ML (5830)
「stat.ML」カテゴリーアーカイブ
Optimal Transport for Treatment Effect Estimation
要約 治療選択バイアスが存在するため、観察データから条件付き平均治療効果を推定す … 続きを読む
Addressing GAN Training Instabilities via Tunable Classification Losses
要約 敵対的生成ネットワーク (GAN) は、ジェネレーター (G) とディスク … 続きを読む
Supervised and Penalized Baseline Correction
要約 分光測定では、吸収と散乱の寄与の混合から生じる歪んだスペクトル形状が示され … 続きを読む
Semantic HELM: A Human-Readable Memory for Reinforcement Learning
要約 現実世界に導入された強化学習エージェントは、多くの場合、部分的に観測可能な … 続きを読む
Fundamental Limits of Membership Inference Attacks on Machine Learning Models
要約 メンバーシップ推論攻撃 (MIA) は、特定のデータ ポイントがトレーニン … 続きを読む
Tackling Heavy-Tailed Rewards in Reinforcement Learning with Function Approximation: Minimax Optimal and Instance-Dependent Regret Bounds
要約 多くの研究が、均一に制限された報酬を伴う強化学習 (RL) の効率的なアル … 続きを読む
LeanDojo: Theorem Proving with Retrieval-Augmented Language Models
要約 大規模言語モデル (LLM) は、Lean などの証明アシスタントを使用し … 続きを読む
Algorithmic Foundations of Empirical X-risk Minimization
要約 この原稿では、{\bf empirical X-risk minimiza … 続きを読む
Towards Understanding Sycophancy in Language Models
要約 人間のフィードバックは、AI アシスタントの微調整によく利用されます。 し … 続きを読む