cs.CV」カテゴリーアーカイブ

OMG: Opacity Matters in Material Modeling with Gaussian Splatting

要約 一連の画像からジオメトリ、マテリアル、照明を分解すること、すなわちインバー … 続きを読む

カテゴリー: cs.CV | OMG: Opacity Matters in Material Modeling with Gaussian Splatting はコメントを受け付けていません

IRisPath: Enhancing Costmap for Off-Road Navigation with Robust IR-RGB Fusion for Improved Day and Night Traversability

要約 オフロードでの自律航法は、農業、建設、捜索救助、防衛などの用途で必要とされ … 続きを読む

カテゴリー: cs.CV, cs.RO | IRisPath: Enhancing Costmap for Off-Road Navigation with Robust IR-RGB Fusion for Improved Day and Night Traversability はコメントを受け付けていません

ET-SEED: Efficient Trajectory-Level SE(3) Equivariant Diffusion Policy

要約 拡散政策などの模倣学習は、様々なロボット操作タスクにおいて有効であることが … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | ET-SEED: Efficient Trajectory-Level SE(3) Equivariant Diffusion Policy はコメントを受け付けていません

Pair-VPR: Place-Aware Pre-training and Contrastive Pair Classification for Visual Place Recognition with Vision Transformers

要約 本研究では、視覚的場所認識(Visual Place Recognitio … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Pair-VPR: Place-Aware Pre-training and Contrastive Pair Classification for Visual Place Recognition with Vision Transformers はコメントを受け付けていません

Evaluating Low-Resource Lane Following Algorithms for Compute-Constrained Automated Vehicles

要約 信頼性の高い車線追従は、自動運転やアシスト運転にとって不可欠であるが、既存 … 続きを読む

カテゴリー: cs.CV, cs.RO | Evaluating Low-Resource Lane Following Algorithms for Compute-Constrained Automated Vehicles はコメントを受け付けていません

Eagle: Exploring The Design Space for Multimodal LLMs with Mixture of Encoders

要約 複雑な視覚情報を正確に解釈する能力は、マルチモーダル大規模言語モデル(ML … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Eagle: Exploring The Design Space for Multimodal LLMs with Mixture of Encoders はコメントを受け付けていません

RobotFingerPrint: Unified Gripper Coordinate Space for Multi-Gripper Grasp Synthesis and Transfer

要約 我々は、把持合成と把持移動のための統一グリッパー座標空間(Unified … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | RobotFingerPrint: Unified Gripper Coordinate Space for Multi-Gripper Grasp Synthesis and Transfer はコメントを受け付けていません

A Survey on Vision-Language-Action Models for Embodied AI

要約 身体化AIは、身体化されたエージェントを制御して物理世界でタスクを実行する … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.RO | A Survey on Vision-Language-Action Models for Embodied AI はコメントを受け付けていません

Calib3D: Calibrating Model Preferences for Reliable 3D Scene Understanding

要約 セーフティクリティカルな3Dシーン理解タスクでは、3D知覚モデルからの予測 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Calib3D: Calibrating Model Preferences for Reliable 3D Scene Understanding はコメントを受け付けていません

DynamicCity: Large-Scale 4D Occupancy Generation from Dynamic Scenes

要約 都市シーンの生成は近年急速に発展している。しかし、既存の手法は主に静的で単 … 続きを読む

カテゴリー: cs.CV, cs.RO | DynamicCity: Large-Scale 4D Occupancy Generation from Dynamic Scenes はコメントを受け付けていません