cs.CV」カテゴリーアーカイブ

Keypoint Detection and Description for Raw Bayer Images

要約 キーポイント検出とローカル機能の説明は、ロボット認識の基本的なタスクであり … 続きを読む

カテゴリー: cs.CV | Keypoint Detection and Description for Raw Bayer Images はコメントを受け付けていません

Language-Depth Navigated Thermal and Visible Image Fusion

要約 深さ誘導マルチモーダルフュージョンは、可視および赤外線画像から深さ情報を組 … 続きを読む

カテゴリー: cs.CV | Language-Depth Navigated Thermal and Visible Image Fusion はコメントを受け付けていません

OmniPaint: Mastering Object-Oriented Editing via Disentangled Insertion-Removal Inpainting

要約 拡散ベースの生成モデルは、オブジェクト指向の画像編集に革命をもたらしました … 続きを読む

カテゴリー: cs.CV | OmniPaint: Mastering Object-Oriented Editing via Disentangled Insertion-Removal Inpainting はコメントを受け付けていません

GarmentCrafter: Progressive Novel View Synthesis for Single-View 3D Garment Reconstruction and Editing

要約 GarmentCrafterを紹介します。これは、非専門的なユーザーがシン … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR | GarmentCrafter: Progressive Novel View Synthesis for Single-View 3D Garment Reconstruction and Editing はコメントを受け付けていません

CoLMDriver: LLM-based Negotiation Benefits Cooperative Autonomous Driving

要約 車両から車両への(V2V)協同的自律運転は、単一エージェントシステムに固有 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MA | CoLMDriver: LLM-based Negotiation Benefits Cooperative Autonomous Driving はコメントを受け付けていません

‘Principal Components’ Enable A New Language of Images

要約 潜在的なトークン空間に証明可能なPCA様構造を埋め込む新しい視覚トークン化 … 続きを読む

カテゴリー: cs.CV | ‘Principal Components’ Enable A New Language of Images はコメントを受け付けていません

OmniMamba: Efficient and Unified Multimodal Understanding and Generation via State Space Models

要約 統一されたマルチモーダル理解と視覚生成(またはマルチモーダル生成)モデルの … 続きを読む

カテゴリー: cs.CV | OmniMamba: Efficient and Unified Multimodal Understanding and Generation via State Space Models はコメントを受け付けていません

QuoTA: Query-oriented Token Assignment via CoT Query Decouple for Long Video Comprehension

要約 長いビデオ理解における最近の進歩は、通常、注意分布に基づいて視覚トークン剪 … 続きを読む

カテゴリー: cs.CV | QuoTA: Query-oriented Token Assignment via CoT Query Decouple for Long Video Comprehension はコメントを受け付けていません

AthletePose3D: A Benchmark Dataset for 3D Human Pose Estimation and Kinematic Validation in Athletic Movements

要約 人間のポーズ推定は、スポーツ科学、リハビリテーション、および生体力学的研究 … 続きを読む

カテゴリー: cs.CV | AthletePose3D: A Benchmark Dataset for 3D Human Pose Estimation and Kinematic Validation in Athletic Movements はコメントを受け付けていません

DaD: Distilled Reinforcement Learning for Diverse Keypoint Detection

要約 キーポイントは、構造からの構造(SFM)システムが数千の画像にスケーリング … 続きを読む

カテゴリー: cs.CV | DaD: Distilled Reinforcement Learning for Diverse Keypoint Detection はコメントを受け付けていません