cs.CV」カテゴリーアーカイブ

Navigating the Maze of Explainable AI: A Systematic Approach to Evaluating Methods and Metrics

要約 Explainable AI (XAI) は、無数の手法とその有効性を評価 … 続きを読む

カテゴリー: cs.CV | Navigating the Maze of Explainable AI: A Systematic Approach to Evaluating Methods and Metrics はコメントを受け付けていません

Stable-V2A: Synthesis of Synchronized Sound Effects with Temporal and Semantic Controls

要約 サウンド デザイナーやフォーリー アーティストは通常​​、ビデオ内の関心の … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | Stable-V2A: Synthesis of Synchronized Sound Effects with Temporal and Semantic Controls はコメントを受け付けていません

Perception-guided Jailbreak against Text-to-Image Models

要約 近年、Text-to-Image (T2I) モデルがその目覚ましい進歩に … 続きを読む

カテゴリー: cs.CV | Perception-guided Jailbreak against Text-to-Image Models はコメントを受け付けていません

SegKAN: High-Resolution Medical Image Segmentation with Long-Distance Dependencies

要約 コンピューター断層撮影スキャンにおける肝血管は、画像の断片化やノイズ干渉を … 続きを読む

カテゴリー: cs.CV, eess.IV | SegKAN: High-Resolution Medical Image Segmentation with Long-Distance Dependencies はコメントを受け付けていません

Familiarity-Based Open-Set Recognition Under Adversarial Attacks

要約 新しいカテゴリの識別である開集合認識 (OSR) は、現実世界のアプリケー … 続きを読む

カテゴリー: cs.CV, cs.LG | Familiarity-Based Open-Set Recognition Under Adversarial Attacks はコメントを受け付けていません

GeoDiffuser: Geometry-Based Image Editing with Diffusion Models

要約 画像生成モデルの成功により、テキストやその他のユーザー入力に基づいて画像を … 続きを読む

カテゴリー: cs.CV | GeoDiffuser: Geometry-Based Image Editing with Diffusion Models はコメントを受け付けていません

Edicho: Consistent Image Editing in the Wild

要約 ニーズが実証されているため、実際の画像全体で一貫した編集を行うことは、オブ … 続きを読む

カテゴリー: cs.CV | Edicho: Consistent Image Editing in the Wild はコメントを受け付けていません

Prometheus: 3D-Aware Latent Diffusion Models for Feed-Forward Text-to-3D Scene Generation

要約 この研究では、オブジェクト レベルとシーン レベルの両方で数秒でテキストか … 続きを読む

カテゴリー: cs.CV | Prometheus: 3D-Aware Latent Diffusion Models for Feed-Forward Text-to-3D Scene Generation はコメントを受け付けていません

LINK: Adaptive Modality Interaction for Audio-Visual Video Parsing

要約 オーディオビジュアルビデオの解析は、弱いラベルによってビデオを分類すること … 続きを読む

カテゴリー: cs.CV | LINK: Adaptive Modality Interaction for Audio-Visual Video Parsing はコメントを受け付けていません

SyncDiff: Synchronized Motion Diffusion for Multi-Body Human-Object Interaction Synthesis

要約 現実的な人間とオブジェクトのインタラクション モーションを合成することは、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO | SyncDiff: Synchronized Motion Diffusion for Multi-Body Human-Object Interaction Synthesis はコメントを受け付けていません