cs.CV」カテゴリーアーカイブ

Do Vision-Language Models Represent Space and How? Evaluating Spatial Frame of Reference Under Ambiguities

要約 状況に応じたコミュニケーションでの空間的表現は、スピーカーやリスナーが採用 … 続きを読む

カテゴリー: cs.CL, cs.CV | Do Vision-Language Models Represent Space and How? Evaluating Spatial Frame of Reference Under Ambiguities はコメントを受け付けていません

IMAGGarment-1: Fine-Grained Garment Generation for Controllable Fashion Design

要約 このホワイトペーパーでは、シルエット、色、ロゴの配置を正確に制御できる高忠 … 続きを読む

カテゴリー: cs.CV | IMAGGarment-1: Fine-Grained Garment Generation for Controllable Fashion Design はコメントを受け付けていません

Single-Shot Shape and Reflectance with Spatial Polarization Multiplexing

要約 単一の偏光画像からオブジェクトの形状と反射率を再構築するための空間分極マル … 続きを読む

カテゴリー: cs.CV | Single-Shot Shape and Reflectance with Spatial Polarization Multiplexing はコメントを受け付けていません

PerceptionLM: Open-Access Data and Models for Detailed Visual Understanding

要約 ビジョン言語モデルはコンピュータービジョンの研究に不可欠ですが、多くの高性 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | PerceptionLM: Open-Access Data and Models for Detailed Visual Understanding はコメントを受け付けていません

ViTa-Zero: Zero-shot Visuotactile Object 6D Pose Estimation

要約 オブジェクト6Dのポーズ推定は、特に操作タスクでは、ロボット工学の重要な課 … 続きを読む

カテゴリー: cs.CV, cs.RO | ViTa-Zero: Zero-shot Visuotactile Object 6D Pose Estimation はコメントを受け付けていません

Perception Encoder: The best visual embeddings are not at the output of the network

要約 単純なビジョン言語学習を通じてトレーニングされた画像およびビデオ理解用の最 … 続きを読む

カテゴリー: cs.CV | Perception Encoder: The best visual embeddings are not at the output of the network はコメントを受け付けていません

CAP-Net: A Unified Network for 6D Pose and Size Estimation of Categorical Articulated Parts from a Single RGB-D Image

要約 このペーパーは、ロボット操作タスクにおける明確なオブジェクトのカテゴリレベ … 続きを読む

カテゴリー: cs.CV, cs.RO | CAP-Net: A Unified Network for 6D Pose and Size Estimation of Categorical Articulated Parts from a Single RGB-D Image はコメントを受け付けていません

Securing the Skies: A Comprehensive Survey on Anti-UAV Methods, Benchmarking, and Future Directions

要約 無人航空機(UAV)は、インフラストラクチャの検査、監視、および関連するタ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO | Securing the Skies: A Comprehensive Survey on Anti-UAV Methods, Benchmarking, and Future Directions はコメントを受け付けていません

Know Where You’re Uncertain When Planning with Multimodal Foundation Models: A Formal Framework

要約 マルチモーダルファンデーションモデルは、実行可能な計画を生成するために感覚 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Know Where You’re Uncertain When Planning with Multimodal Foundation Models: A Formal Framework はコメントを受け付けていません

StructRe: Rewriting for Structured Shape Modeling

要約 人工の3D形状は、部品と階層で自然に編成されています。 このような構造は、 … 続きを読む

カテゴリー: cs.CV | StructRe: Rewriting for Structured Shape Modeling はコメントを受け付けていません