cs.AI」カテゴリーアーカイブ

Machine Unlearning under Overparameterization

要約 マシンの非学習アルゴリズムは、特定のトレーニングサンプルの影響を削除するこ … 続きを読む

カテゴリー: cs.AI, cs.LG | Machine Unlearning under Overparameterization はコメントを受け付けていません

Adjoint Sampling: Highly Scalable Diffusion Samplers via Adjoint Matching

要約 非正常密度またはエネルギー関数からサンプリングする拡散プロセスを学習するた … 続きを読む

カテゴリー: cs.AI, cs.LG | Adjoint Sampling: Highly Scalable Diffusion Samplers via Adjoint Matching はコメントを受け付けていません

One Rank at a Time: Cascading Error Dynamics in Sequential Learning

要約 複雑なタスクがよりシンプルで階層的なコンポーネントに分解される順次学習は、 … 続きを読む

カテゴリー: cs.AI, cs.LG, math.OC | One Rank at a Time: Cascading Error Dynamics in Sequential Learning はコメントを受け付けていません

Effective and Efficient One-pass Compression of Speech Foundation Models Using Sparsity-aware Self-pinching Gates

要約 このペーパーでは、モデルの剪定とパラメーターの更新を単一の段階にしっかりと … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Effective and Efficient One-pass Compression of Speech Foundation Models Using Sparsity-aware Self-pinching Gates はコメントを受け付けていません

Robust Localization, Mapping, and Navigation for Quadruped Robots

要約 四足ロボットは現在、強力な補強学習コントローラーと安価で堅牢な商用プラット … 続きを読む

カテゴリー: cs.AI, cs.RO | Robust Localization, Mapping, and Navigation for Quadruped Robots はコメントを受け付けていません

Automating Thought of Search: A Journey Towards Soundness and Completeness

要約 大規模な言語モデル(LLM)が使用されており、検索が必要な計画問題を解決し … 続きを読む

カテゴリー: cs.AI | Automating Thought of Search: A Journey Towards Soundness and Completeness はコメントを受け付けていません

The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models

要約 このペーパーは、LLMSとの推論のためにRLをスケーリングする際の大きな障 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models はコメントを受け付けていません

SCIZOR: A Self-Supervised Approach to Data Curation for Large-Scale Imitation Learning

要約 模倣学習は、人間のデモンストレーションから多様な行動を取得できるようにする … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | SCIZOR: A Self-Supervised Approach to Data Curation for Large-Scale Imitation Learning はコメントを受け付けていません

Learning Composable Chains-of-Thought

要約 大規模な言語モデル(LLM)を推論するための一般的なアプローチは、分布内の … 続きを読む

カテゴリー: cs.AI, cs.CL | Learning Composable Chains-of-Thought はコメントを受け付けていません

FastTD3: Simple, Fast, and Capable Reinforcement Learning for Humanoid Control

要約 強化学習(RL)はロボット工学の大きな進歩を遂げていますが、その複雑さと長 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | FastTD3: Simple, Fast, and Capable Reinforcement Learning for Humanoid Control はコメントを受け付けていません