cs.CV」カテゴリーアーカイブ

Enhanced OoD Detection through Cross-Modal Alignment of Multi-Modal Representations

要約 分散除外検出に関する以前の研究(OODD)は、主に単一モダリティモデルに焦 … 続きを読む

カテゴリー: cs.AI, cs.CV | Enhanced OoD Detection through Cross-Modal Alignment of Multi-Modal Representations はコメントを受け付けていません

Generative Omnimatte: Learning to Decompose Video into Layers

要約 ビデオと入力オブジェクトマスクのセットを考えると、Omnimatteメソッ … 続きを読む

カテゴリー: cs.CV | Generative Omnimatte: Learning to Decompose Video into Layers はコメントを受け付けていません

DAGait: Generalized Skeleton-Guided Data Alignment for Gait Recognition

要約 歩行認識は、コンピュータービジョンの分野内の有望で革新的な分野として浮上し … 続きを読む

カテゴリー: cs.CV | DAGait: Generalized Skeleton-Guided Data Alignment for Gait Recognition はコメントを受け付けていません

Dual-domain Multi-path Self-supervised Diffusion Model for Accelerated MRI Reconstruction

要約 磁気共鳴イメージング(MRI)は重要な診断ツールですが、本質的に長い獲得時 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Dual-domain Multi-path Self-supervised Diffusion Model for Accelerated MRI Reconstruction はコメントを受け付けていません

Learning to segment anatomy and lesions from disparately labeled sources in brain MRI

要約 脳磁気共鳴画像(MRI)の病変とともに健康な組織構造のセグメント化は、病変 … 続きを読む

カテゴリー: cs.CV, eess.IV | Learning to segment anatomy and lesions from disparately labeled sources in brain MRI はコメントを受け付けていません

Interleaved Scene Graphs for Interleaved Text-and-Image Generation Assessment

要約 多くの現実世界のユーザークエリ(たとえば、「卵のフライドライスを作るのはど … 続きを読む

カテゴリー: cs.CL, cs.CV | Interleaved Scene Graphs for Interleaved Text-and-Image Generation Assessment はコメントを受け付けていません

Positive2Negative: Breaking the Information-Lossy Barrier in Self-Supervised Single Image Denoising

要約 画像除去は画質を向上させ、さまざまな計算写真アプリケーションで基礎的な手法 … 続きを読む

カテゴリー: cs.CV | Positive2Negative: Breaking the Information-Lossy Barrier in Self-Supervised Single Image Denoising はコメントを受け付けていません

3DSwapping: Texture Swapping For 3D Object From Single Reference Image

要約 3Dテクスチャスワッピングにより、3Dオブジェクトテクスチャのカスタマイズ … 続きを読む

カテゴリー: cs.CV | 3DSwapping: Texture Swapping For 3D Object From Single Reference Image はコメントを受け付けていません

MC-LLaVA: Multi-Concept Personalized Vision-Language Model

要約 現在のビジョン言語モデル(VLM)は、視覚的な質問応答など、さまざまなタス … 続きを読む

カテゴリー: cs.AI, cs.CV | MC-LLaVA: Multi-Concept Personalized Vision-Language Model はコメントを受け付けていません

STEVE: A Step Verification Pipeline for Computer-use Agent Training

要約 グラフィカルユーザーインターフェイスを自律的に操作するためにAIエージェン … 続きを読む

カテゴリー: cs.AI, cs.CV | STEVE: A Step Verification Pipeline for Computer-use Agent Training はコメントを受け付けていません