cs.LG」カテゴリーアーカイブ

Compositional Causal Reasoning Evaluation in Language Models

要約 因果的推論と構成の推論は、AIの2つの中核となる願望です。 これらの動作の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Compositional Causal Reasoning Evaluation in Language Models はコメントを受け付けていません

Linear Mixture Distributionally Robust Markov Decision Processes

要約 多くの現実世界の意思決定の問題は、オフダイナミクスの課題に直面しています。 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO, stat.ML | Linear Mixture Distributionally Robust Markov Decision Processes はコメントを受け付けていません

Recursive Deep Inverse Reinforcement Learning

要約 展示された行動からの敵の目標を推測することは、サイバーセキュリティ、軍事、 … 続きを読む

カテゴリー: cs.AI, cs.LG | Recursive Deep Inverse Reinforcement Learning はコメントを受け付けていません

Towards Uncertainty Aware Task Delegation and Human-AI Collaborative Decision-Making

要約 ドメイン全体での意思決定をサポートする際の人工知能(AI)の約束が高まって … 続きを読む

カテゴリー: cs.AI, cs.HC, cs.LG | Towards Uncertainty Aware Task Delegation and Human-AI Collaborative Decision-Making はコメントを受け付けていません

Learning Generalized Hamiltonians using fully Symplectic Mappings

要約 多くの重要な物理システムは、保守的であるという重要な特性を持っているハミル … 続きを読む

カテゴリー: cs.AI, cs.LG | Learning Generalized Hamiltonians using fully Symplectic Mappings はコメントを受け付けていません

AFD-STA: Adaptive Filtering Denoising with Spatiotemporal Attention for Chaotic System Prediction

要約 このホワイトペーパーでは、部分的な微分方程式によって支配された高次元のカオ … 続きを読む

カテゴリー: cs.AI, cs.LG | AFD-STA: Adaptive Filtering Denoising with Spatiotemporal Attention for Chaotic System Prediction はコメントを受け付けていません

Backpropagation-Free Metropolis-Adjusted Langevin Algorithm

要約 Backpropagationのない学習に関する最近の研究により、Forw … 続きを読む

カテゴリー: cs.AI, cs.LG | Backpropagation-Free Metropolis-Adjusted Langevin Algorithm はコメントを受け付けていません

Stable Reinforcement Learning for Efficient Reasoning

要約 DeepSeek-R1の成功により、GRPOなどの強化学習(RL)方法に対 … 続きを読む

カテゴリー: cs.AI, cs.LG | Stable Reinforcement Learning for Efficient Reasoning はコメントを受け付けていません

Data Mixing Can Induce Phase Transitions in Knowledge Acquisition

要約 大規模な言語モデル(LLM)は通常、データの混合物でトレーニングされていま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Data Mixing Can Induce Phase Transitions in Knowledge Acquisition はコメントを受け付けていません

How Can I Publish My LLM Benchmark Without Giving the True Answers Away?

要約 インターネット上の大規模な言語モデル(LLM)ベンチマークを公開することは … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ME | How Can I Publish My LLM Benchmark Without Giving the True Answers Away? はコメントを受け付けていません