cs.CV」カテゴリーアーカイブ

PAPL-SLAM: Principal Axis-Anchored Monocular Point-Line SLAM

要約 ポイントライン SLAM システムでは、ライン構造情報の利用とラインの最適 … 続きを読む

カテゴリー: cs.CV, cs.RO | PAPL-SLAM: Principal Axis-Anchored Monocular Point-Line SLAM はコメントを受け付けていません

PIVOT-R: Primitive-Driven Waypoint-Aware World Model for Robotic Manipulation

要約 言語ガイドによるロボット操作は、さまざまな複雑な操作タスクを達成するために … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | PIVOT-R: Primitive-Driven Waypoint-Aware World Model for Robotic Manipulation はコメントを受け付けていません

InterACT: Inter-dependency Aware Action Chunking with Hierarchical Attention Transformers for Bimanual Manipulation

要約 両手操作には、2 つのロボット アームの調整が複雑であるため、単独作業と比 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | InterACT: Inter-dependency Aware Action Chunking with Hierarchical Attention Transformers for Bimanual Manipulation はコメントを受け付けていません

Instruction-Guided Visual Masking

要約 現代の LLM では、指示に従うことが極めて重要です。 ただし、マルチモー … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Instruction-Guided Visual Masking はコメントを受け付けていません

AdaCropFollow: Self-Supervised Online Adaptation for Visual Under-Canopy Navigation

要約 樹冠下の農業用ロボットは、生育期を通じて正確な監視、散布、除草、植物操作作 … 続きを読む

カテゴリー: cs.CV, cs.RO | AdaCropFollow: Self-Supervised Online Adaptation for Visual Under-Canopy Navigation はコメントを受け付けていません

DH-VTON: Deep Text-Driven Virtual Try-On via Hybrid Attention Learning

要約 Virtual Try-ON (VTON) は、特定の衣服を着た特定の人物 … 続きを読む

カテゴリー: cs.AI, cs.CV | DH-VTON: Deep Text-Driven Virtual Try-On via Hybrid Attention Learning はコメントを受け付けていません

Mixture of Experts Made Personalized: Federated Prompt Learning for Vision-Language Models

要約 CLIP のような事前トレーニング済み視覚言語モデル (VLM) の迅速な … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | Mixture of Experts Made Personalized: Federated Prompt Learning for Vision-Language Models はコメントを受け付けていません

Developing Generalist Foundation Models from a Multimodal Dataset for 3D Computed Tomography

要約 コンピューター ビジョンは、マルチモーダル エンコーディングと、チャットベ … 続きを読む

カテゴリー: cs.CV | Developing Generalist Foundation Models from a Multimodal Dataset for 3D Computed Tomography はコメントを受け付けていません

QueensCAMP: an RGB-D dataset for robust Visual SLAM

要約 Visual Simultaneous Localization and … 続きを読む

カテゴリー: cs.AI, cs.CV | QueensCAMP: an RGB-D dataset for robust Visual SLAM はコメントを受け付けていません

MambaPainter: Neural Stroke-Based Rendering in a Single Step

要約 ストロークベースのレンダリングは、ブラシ ストロークのシーケンスを予測する … 続きを読む

カテゴリー: cs.CV | MambaPainter: Neural Stroke-Based Rendering in a Single Step はコメントを受け付けていません