「cs.AI」カテゴリーアーカイブ

Thinking vs. Doing: Agents that Reason by Scaling Test-Time Interaction

投稿日: 2025年6月11日作成者: jarxiv

要約テスト時間スケーリングの現在のパラダイムは、応答を生成する前に、長い推論ト … 続きを読む →

カテゴリー: cs.AI, cs.LG | コメントを受け付けていません

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

投稿日: 2025年6月11日作成者: jarxiv

要約私たちの目的は、低レベルのスキルと、一連の画像を含む少数の短距離デモンスト … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Towards Autonomous Reinforcement Learning for Real-World Robotic Manipulation with Large Language Models

投稿日: 2025年6月11日作成者: jarxiv

要約大規模な言語モデル（LLMS）および視覚言語モデル（VLM）の最近の進歩は … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

Imperative Learning: A Self-supervised Neuro-Symbolic Learning Framework for Robot Autonomy

投稿日: 2025年6月10日作成者: jarxiv

要約強化や模倣学習などのデータ駆動型の方法は、ロボットの自律性において顕著な成 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Unifying 2D and 3D Vision-Language Understanding

投稿日: 2025年6月10日作成者: jarxiv

要約 3Dビジョン言語学習の進歩は、大規模な3Dデータセットの希少性によって妨げ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Real-Time Execution of Action Chunking Flow Policies

投稿日: 2025年6月10日作成者: jarxiv

要約最新のAIシステム、特に物理的な世界と相互作用するシステムは、リアルタイム … 続きを読む →

カテゴリー: cs.AI, cs.LG, cs.RO | コメントを受け付けていません

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

投稿日: 2025年6月10日作成者: jarxiv

要約私たちの目的は、低レベルのスキルと、一連の画像を含む少数の短距離デモンスト … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

Language-Grounded Hierarchical Planning and Execution with Multi-Robot 3D Scene Graphs

投稿日: 2025年6月10日作成者: jarxiv

要約このホワイトペーパーでは、3Dシーングラフで有効になったマッピング、ローカ … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations

投稿日: 2025年6月10日作成者: jarxiv

要約 LLMSの出現と他のデータモダリティとの統合により、マルチモーダル3D知覚 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.RO | コメントを受け付けていません

Curriculum Learning With Counterfactual Group Relative Policy Advantage For Multi-Agent Reinforcement Learning

投稿日: 2025年6月10日作成者: jarxiv

要約マルチエージェント補強学習（MARL）は、協力的な敵対的なタスクで強力なパ … 続きを読む →

カテゴリー: cs.AI, cs.RO | コメントを受け付けていません

「cs.AI」カテゴリーアーカイブ

Thinking vs. Doing: Agents that Reason by Scaling Test-Time Interaction

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

Towards Autonomous Reinforcement Learning for Real-World Robotic Manipulation with Large Language Models

Imperative Learning: A Self-supervised Neuro-Symbolic Learning Framework for Robot Autonomy

Unifying 2D and 3D Vision-Language Understanding

Real-Time Execution of Action Chunking Flow Policies

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

Language-Grounded Hierarchical Planning and Execution with Multi-Robot 3D Scene Graphs

MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations

Curriculum Learning With Counterfactual Group Relative Policy Advantage For Multi-Agent Reinforcement Learning

最近の投稿

最近のコメント

アーカイブ

カテゴリー