月別アーカイブ: 2024年3月

FutureDepth: Learning to Predict the Future Improves Video Depth Estimation

要約 この論文では、新しいビデオ奥行き推定アプローチ、FutureDepth を … 続きを読む

カテゴリー: cs.CV | FutureDepth: Learning to Predict the Future Improves Video Depth Estimation はコメントを受け付けていません

GVGEN: Text-to-3D Generation with Volumetric Representation

要約 近年、3D ガウス スプラッティングは 3D 再構成および生成のための強力 … 続きを読む

カテゴリー: cs.CV | GVGEN: Text-to-3D Generation with Volumetric Representation はコメントを受け付けていません

WHAC: World-grounded Humans and Cameras

要約 単眼ビデオからワールド座標系で正確なスケールで人間とカメラの軌跡を推定する … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.GR, cs.LG, cs.RO | WHAC: World-grounded Humans and Cameras はコメントを受け付けていません

FaceXFormer: A Unified Transformer for Facial Analysis

要約 この研究では、顔解析、ランドマーク検出、頭姿勢推定、属性認識、年齢、性別、 … 続きを読む

カテゴリー: cs.CV | FaceXFormer: A Unified Transformer for Facial Analysis はコメントを受け付けていません

TexTile: A Differentiable Metric for Texture Tileability

要約 我々は、繰り返しアーティファクトを導入することなくテクスチャ画像をそれ自体 … 続きを読む

カテゴリー: 68T07, 68U05, cs.AI, cs.CV, cs.GR, cs.LG, I.2.10 | TexTile: A Differentiable Metric for Texture Tileability はコメントを受け付けていません

FRESCO: Spatial-Temporal Correspondence for Zero-Shot Video Translation

要約 テキストから画像への拡散モデルの顕著な有効性により、ビデオ領域での潜在的な … 続きを読む

カテゴリー: cs.CV | FRESCO: Spatial-Temporal Correspondence for Zero-Shot Video Translation はコメントを受け付けていません

FouriScale: A Frequency Perspective on Training-Free High-Resolution Image Synthesis

要約 この研究では、事前トレーニングされた拡散モデルからの高解像度画像の生成を詳 … 続きを読む

カテゴリー: cs.CV | FouriScale: A Frequency Perspective on Training-Free High-Resolution Image Synthesis はコメントを受け付けていません

Negative Yields Positive: Unified Dual-Path Adapter for Vision-Language Models

要約 最近、大規模な事前トレーニング済み視覚言語モデル (VLM) は、オープン … 続きを読む

カテゴリー: cs.CL, cs.CV | Negative Yields Positive: Unified Dual-Path Adapter for Vision-Language Models はコメントを受け付けていません

Chain-of-Spot: Interactive Reasoning Improves Large Vision-Language Models

要約 視覚言語理解の領域では、視覚コンテンツの解釈と推論におけるモデルの熟練度が … 続きを読む

カテゴリー: cs.CV | Chain-of-Spot: Interactive Reasoning Improves Large Vision-Language Models はコメントを受け付けていません

Wear-Any-Way: Manipulable Virtual Try-on via Sparse Correspondence Alignment

要約 この文書では、Wear-Any-Way と呼ばれる、仮想試着のための新しい … 続きを読む

カテゴリー: cs.CV | Wear-Any-Way: Manipulable Virtual Try-on via Sparse Correspondence Alignment はコメントを受け付けていません