cs.CV」カテゴリーアーカイブ

PRIMA: Multi-Image Vision-Language Models for Reasoning Segmentation

要約 Large Vision-Language Model (LVLM) の大 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | PRIMA: Multi-Image Vision-Language Models for Reasoning Segmentation はコメントを受け付けていません

Scaling 4D Representations

要約 ビデオからの純粋な自己教師あり学習については、スケーリングが説得力を持って … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Scaling 4D Representations はコメントを受け付けていません

Generative Multiview Relighting for 3D Reconstruction under Extreme Illumination Variation

要約 異なる環境で撮影された写真から物体の幾何学形状や外観を再構成することは、照 … 続きを読む

カテゴリー: cs.CV | Generative Multiview Relighting for 3D Reconstruction under Extreme Illumination Variation はコメントを受け付けていません

LeviTor: 3D Trajectory Oriented Image-to-Video Synthesis

要約 ドラッグベースのインタラクションの直観的な性質により、画像からビデオへの合 … 続きを読む

カテゴリー: cs.CV | LeviTor: 3D Trajectory Oriented Image-to-Video Synthesis はコメントを受け付けていません

Flowing from Words to Pixels: A Framework for Cross-Modality Evolution

要約 拡散モデルとその一般化であるフロー マッチングは、メディア生成の分野に顕著 … 続きを読む

カテゴリー: cs.CV | Flowing from Words to Pixels: A Framework for Cross-Modality Evolution はコメントを受け付けていません

EnvGS: Modeling View-Dependent Appearance with Environment Gaussian

要約 現実世界のシーンの複雑な反射を 2D 画像から再構築することは、フォトリア … 続きを読む

カテゴリー: cs.CV | EnvGS: Modeling View-Dependent Appearance with Environment Gaussian はコメントを受け付けていません

UIP2P: Unsupervised Instruction-based Image Editing via Cycle Edit Consistency

要約 私たちは、トレーニング中にグラウンドトゥルース編集された画像の必要性を排除 … 続きを読む

カテゴリー: cs.CV | UIP2P: Unsupervised Instruction-based Image Editing via Cycle Edit Consistency はコメントを受け付けていません

A Black-Box Evaluation Framework for Semantic Robustness in Bird’s Eye View Detection

要約 カメラベースの鳥瞰図 (BEV) 認識モデルは、深層学習の堅牢性と信頼性に … 続きを読む

カテゴリー: cs.CV | A Black-Box Evaluation Framework for Semantic Robustness in Bird’s Eye View Detection はコメントを受け付けていません

GaraMoSt: Parallel Multi-Granularity Motion and Structural Modeling for Efficient Multi-Frame Interpolation in DSA Images

要約 デジタル サブトラクション アンギオグラフィー (DSA) 画像の迅速かつ … 続きを読む

カテゴリー: cs.CV | GaraMoSt: Parallel Multi-Granularity Motion and Structural Modeling for Efficient Multi-Frame Interpolation in DSA Images はコメントを受け付けていません

FashionComposer: Compositional Fashion Image Generation

要約 構成的なファッション画像を生成するための FashionComposer … 続きを読む

カテゴリー: cs.CV | FashionComposer: Compositional Fashion Image Generation はコメントを受け付けていません