cs.CV」カテゴリーアーカイブ

LOCATEdit: Graph Laplacian Optimized Cross Attention for Localized Text-Guided Image Editing

要約 テキスト誘導画像編集は、一般的な構造と背景の忠実度を維持しながら、自然言語 … 続きを読む

カテゴリー: cs.AI, cs.CV | LOCATEdit: Graph Laplacian Optimized Cross Attention for Localized Text-Guided Image Editing はコメントを受け付けていません

Generalizable Prompt Learning of CLIP: A Brief Overview

要約 クリップなどの既存のビジョン言語モデル(VLM)は、さまざまな下流タスクに … 続きを読む

カテゴリー: cs.CL, cs.CV | Generalizable Prompt Learning of CLIP: A Brief Overview はコメントを受け付けていません

Unified Multimodal Discrete Diffusion

要約 複数のモダリティにわたって理解して生成できるマルチモーダル生成モデルは、左 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | Unified Multimodal Discrete Diffusion はコメントを受け付けていません

SimBEV: A Synthetic Multi-Task Multi-Sensor Driving Data Generation Tool and Dataset

要約 BEV表現がマルチモーダルセンサーの融合を促進するため、Bird&#821 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | SimBEV: A Synthetic Multi-Task Multi-Sensor Driving Data Generation Tool and Dataset はコメントを受け付けていません

SyncDiff: Synchronized Motion Diffusion for Multi-Body Human-Object Interaction Synthesis

要約 現実的な人間とオブジェクトの相互作用の動きを統合することは、VR/ARと人 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | SyncDiff: Synchronized Motion Diffusion for Multi-Body Human-Object Interaction Synthesis はコメントを受け付けていません

UGNA-VPR: A Novel Training Paradigm for Visual Place Recognition Based on Uncertainty-Guided NeRF Augmentation

要約 視覚的な場所認識(VPR)は、ロボットが以前に訪れた場所を特定するために重 … 続きを読む

カテゴリー: cs.CV, cs.RO | UGNA-VPR: A Novel Training Paradigm for Visual Place Recognition Based on Uncertainty-Guided NeRF Augmentation はコメントを受け付けていません

STAMICS: Splat, Track And Map with Integrated Consistency and Semantics for Dense RGB-D SLAM

要約 同時ローカリゼーションとマッピング(SLAM)は、ロボット工学の重要なタス … 続きを読む

カテゴリー: cs.CV, cs.RO | STAMICS: Splat, Track And Map with Integrated Consistency and Semantics for Dense RGB-D SLAM はコメントを受け付けていません

How NeRFs and 3D Gaussian Splatting are Reshaping SLAM: a Survey

要約 過去20年にわたって、同時ローカリゼーションとマッピング(SLAM)の分野 … 続きを読む

カテゴリー: cs.CV, cs.RO | How NeRFs and 3D Gaussian Splatting are Reshaping SLAM: a Survey はコメントを受け付けていません

SyncSDE: A Probabilistic Framework for Diffusion Synchronization

要約 元のドメインを超えて拡張するために、共同生成のために複数の拡散モデルを活用 … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG | SyncSDE: A Probabilistic Framework for Diffusion Synchronization はコメントを受け付けていません

Generalizable Prompt Learning of CLIP: A Brief Overview

要約 クリップなどの既存のビジョン言語モデル(VLM)は、さまざまな下流タスクに … 続きを読む

カテゴリー: cs.CL, cs.CV | Generalizable Prompt Learning of CLIP: A Brief Overview はコメントを受け付けていません