「cs.CV」カテゴリーアーカイブ

HF-Diff: High-Frequency Perceptual Loss and Distribution Matching for One-Step Diffusion-Based Image Super-Resolution

投稿日: 2024年11月21日作成者: jarxiv

要約最近の拡散ベースのシングルステップ超解像手法は、SinSR と比較して優れ … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Generating 3D-Consistent Videos from Unposed Internet Photos

投稿日: 2024年11月21日作成者: jarxiv

要約私たちは、撮影されていないインターネット写真からビデオを生成する問題に対処 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Find Any Part in 3D

投稿日: 2024年11月21日作成者: jarxiv

要約私たちは、3D でのオープンワールドパーツセグメンテーション、つまりテ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

REDUCIO! Generating 1024$\times$1024 Video within 16 Seconds using Extremely Compressed Motion Latents

投稿日: 2024年11月21日作成者: jarxiv

要約商用ビデオ生成モデルは、現実的で忠実度の高い結果を示していますが、依然とし … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

AI-generated Image Detection: Passive or Watermark?

投稿日: 2024年11月21日作成者: jarxiv

要約テキストから画像へのモデルには多くの利点がありますが、重大な社会的リスクも … 続きを読む →

カテゴリー: cs.CR, cs.CV, cs.LG | コメントを受け付けていません

MMTryon: Multi-Modal Multi-Reference Control for High-Quality Fashion Generation

投稿日: 2024年11月21日作成者: jarxiv

要約この文書では、テキスト指示と複数の衣服画像を入力として受け取ることにより、 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

M3D: Dual-Stream Selective State Spaces and Depth-Driven Framework for High-Fidelity Single-View 3D Reconstruction

投稿日: 2024年11月21日作成者: jarxiv

要約複雑なシーンで 1 つの RGB 画像から 3D オブジェクトを正確に再構 … 続きを読む →

カテゴリー: cs.CV, I.3.5 | コメントを受け付けていません

Topological Symmetry Enhanced Graph Convolution for Skeleton-Based Action Recognition

投稿日: 2024年11月21日作成者: jarxiv

要約スケルトンベースのアクション認識は、グラフ畳み込みネットワーク (GCN) … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

LiDAR-BEVMTN: Real-Time LiDAR Bird’s-Eye View Multi-Task Perception Network for Autonomous Driving

投稿日: 2024年11月20日作成者: jarxiv

要約 LiDAR は、自動運転における堅牢な 3D シーン認識に不可欠です。 L … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

AsynEIO: Asynchronous Monocular Event-Inertial Odometry Using Gaussian Process Regression

投稿日: 2024年11月20日作成者: jarxiv

要約イベントカメラを慣性センサーと組み合わせると、高速操縦や低照度環境などの … 続きを読む →

カテゴリー: cs.CV, cs.RO | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

HF-Diff: High-Frequency Perceptual Loss and Distribution Matching for One-Step Diffusion-Based Image Super-Resolution

Generating 3D-Consistent Videos from Unposed Internet Photos

Find Any Part in 3D

REDUCIO! Generating 1024$\times$1024 Video within 16 Seconds using Extremely Compressed Motion Latents

AI-generated Image Detection: Passive or Watermark?

MMTryon: Multi-Modal Multi-Reference Control for High-Quality Fashion Generation

M3D: Dual-Stream Selective State Spaces and Depth-Driven Framework for High-Fidelity Single-View 3D Reconstruction

Topological Symmetry Enhanced Graph Convolution for Skeleton-Based Action Recognition

LiDAR-BEVMTN: Real-Time LiDAR Bird’s-Eye View Multi-Task Perception Network for Autonomous Driving

AsynEIO: Asynchronous Monocular Event-Inertial Odometry Using Gaussian Process Regression

最近の投稿

最近のコメント

アーカイブ

カテゴリー