cs.AI」カテゴリーアーカイブ

AugMapNet: Improving Spatial Latent Structure via BEV Grid Augmentation for Enhanced Vectorized Online HD Map Construction

要約 自律運転には、レーンや横断歩道などのインフラストラクチャ要素を理解する必要 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | AugMapNet: Improving Spatial Latent Structure via BEV Grid Augmentation for Enhanced Vectorized Online HD Map Construction はコメントを受け付けていません

BlobCtrl: A Unified and Flexible Framework for Element-level Image Generation and Editing

要約 要素レベルの視覚操作はデジタルコンテンツの作成に不可欠ですが、現在の拡散ベ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | BlobCtrl: A Unified and Flexible Framework for Element-level Image Generation and Editing はコメントを受け付けていません

Humanoid Policy ~ Human Policy

要約 さまざまなデータを使用したヒューマノイドロボットのトレーニング操作ポリシー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Humanoid Policy ~ Human Policy はコメントを受け付けていません

VideoMind: A Chain-of-LoRA Agent for Long Video Reasoning

要約 独自の時間的次元を備えたビデオは、回答が視覚的で解釈可能な証拠に直接リンク … 続きを読む

カテゴリー: cs.AI, cs.CV | VideoMind: A Chain-of-LoRA Agent for Long Video Reasoning はコメントを受け付けていません

Training Directional Locomotion for Quadrupedal Low-Cost Robotic Systems via Deep Reinforcement Learning

要約 この作業では、現実の世界の低コスト四足動物ロボットの方向移動のディープ補強 … 続きを読む

カテゴリー: cs.AI, cs.RO | Training Directional Locomotion for Quadrupedal Low-Cost Robotic Systems via Deep Reinforcement Learning はコメントを受け付けていません

Low-cost Real-world Implementation of the Swing-up Pendulum for Deep Reinforcement Learning Experiments

要約 Deep Rehnection Learning(DRL)は仮想ドメインと … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.RO, cs.SY, eess.SY | Low-cost Real-world Implementation of the Swing-up Pendulum for Deep Reinforcement Learning Experiments はコメントを受け付けていません

MoMa-Kitchen: A 100K+ Benchmark for Affordance-Grounded Last-Mile Navigation in Mobile Manipulation

要約 モバイル操作では、ナビゲーションと操作はしばしば別々の問題として扱われ、そ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | MoMa-Kitchen: A 100K+ Benchmark for Affordance-Grounded Last-Mile Navigation in Mobile Manipulation はコメントを受け付けていません

EmbodiedVSR: Dynamic Scene Graph-Guided Chain-of-Thought Reasoning for Visual Spatial Tasks

要約 マルチモーダルの大手言語モデル(MLLM)は、具体化された知性を画期的に進 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | EmbodiedVSR: Dynamic Scene Graph-Guided Chain-of-Thought Reasoning for Visual Spatial Tasks はコメントを受け付けていません

Virtual Guidance as a Mid-level Representation for Navigation with Augmented Reality

要約 自律的なナビゲーションのコンテキストでは、特にナビゲーション情報がビジョン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Virtual Guidance as a Mid-level Representation for Navigation with Augmented Reality はコメントを受け付けていません

LIX: Implicitly Infusing Spatial Geometric Prior Knowledge into Visual Semantic Segmentation for Autonomous Driving

要約 視覚セマンティックセグメンテーションのために二重エンコーダを使用してデータ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | LIX: Implicitly Infusing Spatial Geometric Prior Knowledge into Visual Semantic Segmentation for Autonomous Driving はコメントを受け付けていません