cs.AI」カテゴリーアーカイブ

Thinking vs. Doing: Agents that Reason by Scaling Test-Time Interaction

要約 テスト時間スケーリングの現在のパラダイムは、応答を生成する前に、長い推論ト … 続きを読む

カテゴリー: cs.AI, cs.LG | Thinking vs. Doing: Agents that Reason by Scaling Test-Time Interaction はコメントを受け付けていません

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

要約 私たちの目的は、低レベルのスキルと、一連の画像を含む少数の短距離デモンスト … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models はコメントを受け付けていません

Towards Autonomous Reinforcement Learning for Real-World Robotic Manipulation with Large Language Models

要約 大規模な言語モデル(LLMS)および視覚言語モデル(VLM)の最近の進歩は … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Towards Autonomous Reinforcement Learning for Real-World Robotic Manipulation with Large Language Models はコメントを受け付けていません

Imperative Learning: A Self-supervised Neuro-Symbolic Learning Framework for Robot Autonomy

要約 強化や模倣学習などのデータ駆動型の方法は、ロボットの自律性において顕著な成 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Imperative Learning: A Self-supervised Neuro-Symbolic Learning Framework for Robot Autonomy はコメントを受け付けていません

Unifying 2D and 3D Vision-Language Understanding

要約 3Dビジョン言語学習の進歩は、大規模な3Dデータセットの希少性によって妨げ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Unifying 2D and 3D Vision-Language Understanding はコメントを受け付けていません

Real-Time Execution of Action Chunking Flow Policies

要約 最新のAIシステム、特に物理的な世界と相互作用するシステムは、リアルタイム … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO | Real-Time Execution of Action Chunking Flow Policies はコメントを受け付けていません

From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models

要約 私たちの目的は、低レベルのスキルと、一連の画像を含む少数の短距離デモンスト … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | From Pixels to Predicates: Learning Symbolic World Models via Pretrained Vision-Language Models はコメントを受け付けていません

Language-Grounded Hierarchical Planning and Execution with Multi-Robot 3D Scene Graphs

要約 このホワイトペーパーでは、3Dシーングラフで有効になったマッピング、ローカ … 続きを読む

カテゴリー: cs.AI, cs.RO | Language-Grounded Hierarchical Planning and Execution with Multi-Robot 3D Scene Graphs はコメントを受け付けていません

MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations

要約 LLMSの出現と他のデータモダリティとの統合により、マルチモーダル3D知覚 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | MMScan: A Multi-Modal 3D Scene Dataset with Hierarchical Grounded Language Annotations はコメントを受け付けていません

Curriculum Learning With Counterfactual Group Relative Policy Advantage For Multi-Agent Reinforcement Learning

要約 マルチエージェント補強学習(MARL)は、協力的な敵対的なタスクで強力なパ … 続きを読む

カテゴリー: cs.AI, cs.RO | Curriculum Learning With Counterfactual Group Relative Policy Advantage For Multi-Agent Reinforcement Learning はコメントを受け付けていません