cs.CV」カテゴリーアーカイブ

HF-Diff: High-Frequency Perceptual Loss and Distribution Matching for One-Step Diffusion-Based Image Super-Resolution

要約 最近の拡散ベースのシングルステップ超解像手法は、SinSR と比較して優れ … 続きを読む

カテゴリー: cs.CV, cs.LG | HF-Diff: High-Frequency Perceptual Loss and Distribution Matching for One-Step Diffusion-Based Image Super-Resolution はコメントを受け付けていません

Generating 3D-Consistent Videos from Unposed Internet Photos

要約 私たちは、撮影されていないインターネット写真からビデオを生成する問題に対処 … 続きを読む

カテゴリー: cs.CV | Generating 3D-Consistent Videos from Unposed Internet Photos はコメントを受け付けていません

Find Any Part in 3D

要約 私たちは、3D でのオープンワールド パーツ セグメンテーション、つまりテ … 続きを読む

カテゴリー: cs.CV | Find Any Part in 3D はコメントを受け付けていません

REDUCIO! Generating 1024$\times$1024 Video within 16 Seconds using Extremely Compressed Motion Latents

要約 商用ビデオ生成モデルは、現実的で忠実度の高い結果を示していますが、依然とし … 続きを読む

カテゴリー: cs.CV | REDUCIO! Generating 1024$\times$1024 Video within 16 Seconds using Extremely Compressed Motion Latents はコメントを受け付けていません

AI-generated Image Detection: Passive or Watermark?

要約 テキストから画像へのモデルには多くの利点がありますが、重大な社会的リスクも … 続きを読む

カテゴリー: cs.CR, cs.CV, cs.LG | AI-generated Image Detection: Passive or Watermark? はコメントを受け付けていません

MMTryon: Multi-Modal Multi-Reference Control for High-Quality Fashion Generation

要約 この文書では、テキスト指示と複数の衣服画像を入力として受け取ることにより、 … 続きを読む

カテゴリー: cs.CV | MMTryon: Multi-Modal Multi-Reference Control for High-Quality Fashion Generation はコメントを受け付けていません

M3D: Dual-Stream Selective State Spaces and Depth-Driven Framework for High-Fidelity Single-View 3D Reconstruction

要約 複雑なシーンで 1 つの RGB 画像から 3D オブジェクトを正確に再構 … 続きを読む

カテゴリー: cs.CV, I.3.5 | M3D: Dual-Stream Selective State Spaces and Depth-Driven Framework for High-Fidelity Single-View 3D Reconstruction はコメントを受け付けていません

Topological Symmetry Enhanced Graph Convolution for Skeleton-Based Action Recognition

要約 スケルトンベースのアクション認識は、グラフ畳み込みネットワーク (GCN) … 続きを読む

カテゴリー: cs.AI, cs.CV | Topological Symmetry Enhanced Graph Convolution for Skeleton-Based Action Recognition はコメントを受け付けていません

LiDAR-BEVMTN: Real-Time LiDAR Bird’s-Eye View Multi-Task Perception Network for Autonomous Driving

要約 LiDAR は、自動運転における堅牢な 3D シーン認識に不可欠です。 L … 続きを読む

カテゴリー: cs.CV, cs.RO | LiDAR-BEVMTN: Real-Time LiDAR Bird’s-Eye View Multi-Task Perception Network for Autonomous Driving はコメントを受け付けていません

AsynEIO: Asynchronous Monocular Event-Inertial Odometry Using Gaussian Process Regression

要約 イベント カメラを慣性センサーと組み合わせると、高速操縦や低照度環境などの … 続きを読む

カテゴリー: cs.CV, cs.RO | AsynEIO: Asynchronous Monocular Event-Inertial Odometry Using Gaussian Process Regression はコメントを受け付けていません