「cs.LG」カテゴリーアーカイブ

Compositional Causal Reasoning Evaluation in Language Models

投稿日: 2025年5月26日作成者: jarxiv

要約因果的推論と構成の推論は、AIの2つの中核となる願望です。これらの動作の … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

Linear Mixture Distributionally Robust Markov Decision Processes

投稿日: 2025年5月26日作成者: jarxiv

要約多くの現実世界の意思決定の問題は、オフダイナミクスの課題に直面しています。 … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO, stat.ML | コメントを受け付けていません

Recursive Deep Inverse Reinforcement Learning

投稿日: 2025年5月26日作成者: jarxiv

要約展示された行動からの敵の目標を推測することは、サイバーセキュリティ、軍事、 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Towards Uncertainty Aware Task Delegation and Human-AI Collaborative Decision-Making

投稿日: 2025年5月26日作成者: jarxiv

要約ドメイン全体での意思決定をサポートする際の人工知能（AI）の約束が高まって … 続きを読む →

カテゴリー: cs.AI, cs.HC, cs.LG | コメントを受け付けていません

Learning Generalized Hamiltonians using fully Symplectic Mappings

投稿日: 2025年5月26日作成者: jarxiv

要約多くの重要な物理システムは、保守的であるという重要な特性を持っているハミル … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

AFD-STA: Adaptive Filtering Denoising with Spatiotemporal Attention for Chaotic System Prediction

投稿日: 2025年5月26日作成者: jarxiv

要約このホワイトペーパーでは、部分的な微分方程式によって支配された高次元のカオ … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Backpropagation-Free Metropolis-Adjusted Langevin Algorithm

投稿日: 2025年5月26日作成者: jarxiv

要約 Backpropagationのない学習に関する最近の研究により、Forw … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Stable Reinforcement Learning for Efficient Reasoning

投稿日: 2025年5月26日作成者: jarxiv

要約 DeepSeek-R1の成功により、GRPOなどの強化学習（RL）方法に対 … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Data Mixing Can Induce Phase Transitions in Knowledge Acquisition

投稿日: 2025年5月26日作成者: jarxiv

要約大規模な言語モデル（LLM）は通常、データの混合物でトレーニングされていま … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

How Can I Publish My LLM Benchmark Without Giving the True Answers Away?

投稿日: 2025年5月26日作成者: jarxiv

要約インターネット上の大規模な言語モデル（LLM）ベンチマークを公開することは … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG, stat.ME | コメントを受け付けていません

「cs.LG」カテゴリーアーカイブ

Compositional Causal Reasoning Evaluation in Language Models

Linear Mixture Distributionally Robust Markov Decision Processes

Recursive Deep Inverse Reinforcement Learning

Towards Uncertainty Aware Task Delegation and Human-AI Collaborative Decision-Making

Learning Generalized Hamiltonians using fully Symplectic Mappings

AFD-STA: Adaptive Filtering Denoising with Spatiotemporal Attention for Chaotic System Prediction

Backpropagation-Free Metropolis-Adjusted Langevin Algorithm

Stable Reinforcement Learning for Efficient Reasoning

Data Mixing Can Induce Phase Transitions in Knowledge Acquisition

How Can I Publish My LLM Benchmark Without Giving the True Answers Away?

最近の投稿

最近のコメント

アーカイブ

カテゴリー