「cs.AI」カテゴリーアーカイブ

Machine Unlearning under Overparameterization

投稿日: 2025年5月29日作成者: jarxiv

要約マシンの非学習アルゴリズムは、特定のトレーニングサンプルの影響を削除するこ … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

Adjoint Sampling: Highly Scalable Diffusion Samplers via Adjoint Matching

投稿日: 2025年5月29日作成者: jarxiv

要約非正常密度またはエネルギー関数からサンプリングする拡散プロセスを学習するた … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

One Rank at a Time: Cascading Error Dynamics in Sequential Learning

投稿日: 2025年5月29日作成者: jarxiv

要約複雑なタスクがよりシンプルで階層的なコンポーネントに分解される順次学習は、 … 続きを読む →

カテゴリー: cs.AI, cs.LG, math.OC | コメントを受け付けていません

Effective and Efficient One-pass Compression of Speech Foundation Models Using Sparsity-aware Self-pinching Gates

投稿日: 2025年5月29日作成者: jarxiv

要約このペーパーでは、モデルの剪定とパラメーターの更新を単一の段階にしっかりと … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

Robust Localization, Mapping, and Navigation for Quadruped Robots

投稿日: 2025年5月29日作成者: jarxiv

要約四足ロボットは現在、強力な補強学習コントローラーと安価で堅牢な商用プラット … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

Automating Thought of Search: A Journey Towards Soundness and Completeness

投稿日: 2025年5月29日作成者: jarxiv

要約大規模な言語モデル（LLM）が使用されており、検索が必要な計画問題を解決し … 続きを読む →

カテゴリー: cs.AI | コメントを受け付けていません

The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models

投稿日: 2025年5月29日作成者: jarxiv

要約このペーパーは、LLMSとの推論のためにRLをスケーリングする際の大きな障 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.LG | コメントを受け付けていません

SCIZOR: A Self-Supervised Approach to Data Curation for Large-Scale Imitation Learning

投稿日: 2025年5月29日作成者: jarxiv

要約模倣学習は、人間のデモンストレーションから多様な行動を取得できるようにする … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

Learning Composable Chains-of-Thought

投稿日: 2025年5月29日作成者: jarxiv

要約大規模な言語モデル（LLM）を推論するための一般的なアプローチは、分布内の … 続きを読む →

カテゴリー: cs.AI, cs.CL | コメントを受け付けていません

FastTD3: Simple, Fast, and Capable Reinforcement Learning for Humanoid Control

投稿日: 2025年5月29日作成者: jarxiv

要約強化学習（RL）はロボット工学の大きな進歩を遂げていますが、その複雑さと長 … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Machine Unlearning under Overparameterization

Adjoint Sampling: Highly Scalable Diffusion Samplers via Adjoint Matching

One Rank at a Time: Cascading Error Dynamics in Sequential Learning

Effective and Efficient One-pass Compression of Speech Foundation Models Using Sparsity-aware Self-pinching Gates

Robust Localization, Mapping, and Navigation for Quadruped Robots

Automating Thought of Search: A Journey Towards Soundness and Completeness

The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models

SCIZOR: A Self-Supervised Approach to Data Curation for Large-Scale Imitation Learning

Learning Composable Chains-of-Thought

FastTD3: Simple, Fast, and Capable Reinforcement Learning for Humanoid Control

最近の投稿

最近のコメント

アーカイブ

カテゴリー