「cs.CV」カテゴリーアーカイブ

LOCATEdit: Graph Laplacian Optimized Cross Attention for Localized Text-Guided Image Editing

投稿日: 2025年3月31日作成者: jarxiv

要約テキスト誘導画像編集は、一般的な構造と背景の忠実度を維持しながら、自然言語 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Generalizable Prompt Learning of CLIP: A Brief Overview

投稿日: 2025年3月31日作成者: jarxiv

要約クリップなどの既存のビジョン言語モデル（VLM）は、さまざまな下流タスクに … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

Unified Multimodal Discrete Diffusion

投稿日: 2025年3月28日作成者: jarxiv

要約複数のモダリティにわたって理解して生成できるマルチモーダル生成モデルは、左 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

SimBEV: A Synthetic Multi-Task Multi-Sensor Driving Data Generation Tool and Dataset

投稿日: 2025年3月28日作成者: jarxiv

要約 BEV表現がマルチモーダルセンサーの融合を促進するため、Bird&#821 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO | コメントを受け付けていません

SyncDiff: Synchronized Motion Diffusion for Multi-Body Human-Object Interaction Synthesis

投稿日: 2025年3月28日作成者: jarxiv

要約現実的な人間とオブジェクトの相互作用の動きを統合することは、VR/ARと人 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | コメントを受け付けていません

UGNA-VPR: A Novel Training Paradigm for Visual Place Recognition Based on Uncertainty-Guided NeRF Augmentation

投稿日: 2025年3月28日作成者: jarxiv

要約視覚的な場所認識（VPR）は、ロボットが以前に訪れた場所を特定するために重 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

STAMICS: Splat, Track And Map with Integrated Consistency and Semantics for Dense RGB-D SLAM

投稿日: 2025年3月28日作成者: jarxiv

要約同時ローカリゼーションとマッピング（SLAM）は、ロボット工学の重要なタス … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

How NeRFs and 3D Gaussian Splatting are Reshaping SLAM: a Survey

投稿日: 2025年3月28日作成者: jarxiv

要約過去20年にわたって、同時ローカリゼーションとマッピング（SLAM）の分野 … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

SyncSDE: A Probabilistic Framework for Diffusion Synchronization

投稿日: 2025年3月28日作成者: jarxiv

要約元のドメインを超えて拡張するために、共同生成のために複数の拡散モデルを活用 … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.LG | コメントを受け付けていません

Generalizable Prompt Learning of CLIP: A Brief Overview

投稿日: 2025年3月28日作成者: jarxiv

要約クリップなどの既存のビジョン言語モデル（VLM）は、さまざまな下流タスクに … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

LOCATEdit: Graph Laplacian Optimized Cross Attention for Localized Text-Guided Image Editing

Generalizable Prompt Learning of CLIP: A Brief Overview

Unified Multimodal Discrete Diffusion

SimBEV: A Synthetic Multi-Task Multi-Sensor Driving Data Generation Tool and Dataset

SyncDiff: Synchronized Motion Diffusion for Multi-Body Human-Object Interaction Synthesis

UGNA-VPR: A Novel Training Paradigm for Visual Place Recognition Based on Uncertainty-Guided NeRF Augmentation

STAMICS: Splat, Track And Map with Integrated Consistency and Semantics for Dense RGB-D SLAM

How NeRFs and 3D Gaussian Splatting are Reshaping SLAM: a Survey

SyncSDE: A Probabilistic Framework for Diffusion Synchronization

Generalizable Prompt Learning of CLIP: A Brief Overview

最近の投稿

最近のコメント

アーカイブ

カテゴリー