投稿者「jarxiv」のアーカイブ

Automating Thought of Search: A Journey Towards Soundness and Completeness

要約 大規模な言語モデル(LLM)が使用されており、検索が必要な計画問題を解決し … 続きを読む

カテゴリー: cs.AI | Automating Thought of Search: A Journey Towards Soundness and Completeness はコメントを受け付けていません

The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models

要約 このペーパーは、LLMSとの推論のためにRLをスケーリングする際の大きな障 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | The Entropy Mechanism of Reinforcement Learning for Reasoning Language Models はコメントを受け付けていません

SCIZOR: A Self-Supervised Approach to Data Curation for Large-Scale Imitation Learning

要約 模倣学習は、人間のデモンストレーションから多様な行動を取得できるようにする … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | SCIZOR: A Self-Supervised Approach to Data Curation for Large-Scale Imitation Learning はコメントを受け付けていません

Learning Composable Chains-of-Thought

要約 大規模な言語モデル(LLM)を推論するための一般的なアプローチは、分布内の … 続きを読む

カテゴリー: cs.AI, cs.CL | Learning Composable Chains-of-Thought はコメントを受け付けていません

FastTD3: Simple, Fast, and Capable Reinforcement Learning for Humanoid Control

要約 強化学習(RL)はロボット工学の大きな進歩を遂げていますが、その複雑さと長 … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | FastTD3: Simple, Fast, and Capable Reinforcement Learning for Humanoid Control はコメントを受け付けていません

Pre-training for Recommendation Unlearning

要約 グラフニューラルネットワーク(GNNS)を搭載した最新の推奨システム(GN … 続きを読む

カテゴリー: cs.AI, cs.IR, cs.LG | Pre-training for Recommendation Unlearning はコメントを受け付けていません

Position: Uncertainty Quantification Needs Reassessment for Large-language Model Agents

要約 大規模な言語モデル(LLMS)とチャットボットエージェントは、時々間違った … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG | Position: Uncertainty Quantification Needs Reassessment for Large-language Model Agents はコメントを受け付けていません

Maximizing Confidence Alone Improves Reasoning

要約 強化学習(RL)により、機械学習モデルが多くの分野で大きな進歩を達成できる … 続きを読む

カテゴリー: cs.AI, cs.LG | Maximizing Confidence Alone Improves Reasoning はコメントを受け付けていません

Fostering Video Reasoning via Next-Event Prediction

要約 次のトークン予測は、LLMSの推論を可能にする基礎学習タスクとして機能しま … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Fostering Video Reasoning via Next-Event Prediction はコメントを受け付けていません

Universal Domain Adaptation for Semantic Segmentation

要約 セマンティックセグメンテーション(UDA-SS)の監視されていないドメイン … 続きを読む

カテゴリー: cs.CV | Universal Domain Adaptation for Semantic Segmentation はコメントを受け付けていません