cs.CV」カテゴリーアーカイブ

VideoDirector: Precise Video Editing via Text-to-Video Models

要約 テキストから画像 (T2I) モデルを使用した典型的な反転してから編集する … 続きを読む

カテゴリー: cs.CV | VideoDirector: Precise Video Editing via Text-to-Video Models はコメントを受け付けていません

Learning Instance-Specific Parameters of Black-Box Models Using Differentiable Surrogates

要約 微分不可能なコンピューティングまたはブラックボックス コンピューティングの … 続きを読む

カテゴリー: cs.CV | Learning Instance-Specific Parameters of Black-Box Models Using Differentiable Surrogates はコメントを受け付けていません

Distractor-free Generalizable 3D Gaussian Splatting

要約 我々は、Distractor-free Generalizable 3D … 続きを読む

カテゴリー: cs.CV | Distractor-free Generalizable 3D Gaussian Splatting はコメントを受け付けていません

HyperSeg: Towards Universal Visual Segmentation with Large Language Model

要約 この論文は、Visual Large Language Model (VL … 続きを読む

カテゴリー: cs.CV | HyperSeg: Towards Universal Visual Segmentation with Large Language Model はコメントを受け付けていません

Modality-Incremental Learning with Disjoint Relevance Mapping Networks for Image-based Semantic Segmentation

要約 自動運転では、カメラ、深度センサー、赤外線センサーなどのさまざまなセンサー … 続きを読む

カテゴリー: cs.CV | Modality-Incremental Learning with Disjoint Relevance Mapping Networks for Image-based Semantic Segmentation はコメントを受け付けていません

GaNI: Global and Near Field Illumination Aware Neural Inverse Rendering

要約 この論文では、同じ場所に配置された光とカメラでキャプチャされたシーンの画像 … 続きを読む

カテゴリー: cs.CV | GaNI: Global and Near Field Illumination Aware Neural Inverse Rendering はコメントを受け付けていません

Accelerating Vision Diffusion Transformers with Skip Branches

要約 新しい画像およびビデオ生成モデル アーキテクチャである拡散トランスフォーマ … 続きを読む

カテゴリー: cs.CV | Accelerating Vision Diffusion Transformers with Skip Branches はコメントを受け付けていません

Beyond Grids: Exploring Elastic Input Sampling for Vision Transformers

要約 ビジョン トランスフォーマーはさまざまなコンピューター ビジョン タスクで … 続きを読む

カテゴリー: cs.CV | Beyond Grids: Exploring Elastic Input Sampling for Vision Transformers はコメントを受け付けていません

An Ensemble Approach for Brain Tumor Segmentation and Synthesis

要約 磁気共鳴画像法 (MRI)、特に神経画像法における機械学習の統合は、非常に … 続きを読む

カテゴリー: cs.CV, eess.IV | An Ensemble Approach for Brain Tumor Segmentation and Synthesis はコメントを受け付けていません

IG-CFAT: An Improved GAN-Based Framework for Effectively Exploiting Transformers in Real-World Image Super-Resolution

要約 単一画像超解像度 (SISR) の分野では、トランスベースのモデルが大幅な … 続きを読む

カテゴリー: cs.CV, eess.IV | IG-CFAT: An Improved GAN-Based Framework for Effectively Exploiting Transformers in Real-World Image Super-Resolution はコメントを受け付けていません