cs.CV」カテゴリーアーカイブ

VMAS: Video-to-Music Generation via Semantic Alignment in Web Music Videos

要約 ビデオ入力から BGM を生成する方法を学習するためのフレームワークを紹介 … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | VMAS: Video-to-Music Generation via Semantic Alignment in Web Music Videos はコメントを受け付けていません

FreeEnhance: Tuning-Free Image Enhancement via Content-Consistent Noising-and-Denoising Process

要約 テキストから画像への生成モデルの出現により、後処理として実行される画像強調 … 続きを読む

カテゴリー: cs.CV, cs.MM | FreeEnhance: Tuning-Free Image Enhancement via Content-Consistent Noising-and-Denoising Process はコメントを受け付けていません

Hi3D: Pursuing High-Resolution Image-to-3D Generation with Video Diffusion Models

要約 画像から 3D への生成が大幅に進歩したにもかかわらず、既存の方法は、特に … 続きを読む

カテゴリー: cs.CV, cs.MM | Hi3D: Pursuing High-Resolution Image-to-3D Generation with Video Diffusion Models はコメントを受け付けていません

DreamMesh: Jointly Manipulating and Texturing Triangle Meshes for Text-to-3D Generation

要約 強力な 2D 拡散モデルを使用した放射輝度フィールド (NeRF) の学習 … 続きを読む

カテゴリー: cs.CV, cs.MM | DreamMesh: Jointly Manipulating and Texturing Triangle Meshes for Text-to-3D Generation はコメントを受け付けていません

Self-Evolving Depth-Supervised 3D Gaussian Splatting from Rendered Stereo Pairs

要約 3D ガウス スプラッティング (GS) は、基礎となる 3D シーン ジ … 続きを読む

カテゴリー: cs.CV | Self-Evolving Depth-Supervised 3D Gaussian Splatting from Rendered Stereo Pairs はコメントを受け付けていません

EyeCLIP: A visual-language foundation model for multi-modal ophthalmic image analysis

要約 緑内障、黄斑変性症、糖尿病性網膜症などの眼疾患を早期に発見することは、視力 … 続きを読む

カテゴリー: cs.AI, cs.CV | EyeCLIP: A visual-language foundation model for multi-modal ophthalmic image analysis はコメントを受け付けていません

Alignist: CAD-Informed Orientation Distribution Estimation by Fusing Shape and Correspondences

要約 ロボット工学において、対称オブジェクトのより適切な経路計画と処理のために、 … 続きを読む

カテゴリー: cs.CV | Alignist: CAD-Informed Orientation Distribution Estimation by Fusing Shape and Correspondences はコメントを受け付けていません

PaRCE: Probabilistic and Reconstruction-Based Competency Estimation for Safe Navigation Under Perception Uncertainty

要約 知覚ベースのナビゲーション システムは、従来の深度ベースのナビゲーション … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.RO, cs.SY, eess.SY | PaRCE: Probabilistic and Reconstruction-Based Competency Estimation for Safe Navigation Under Perception Uncertainty はコメントを受け付けていません

Loss Distillation via Gradient Matching for Point Cloud Completion with Weighted Chamfer Distance

要約 3D 点群により、環境の幾何学的情報を認識するロボットの能力が強化され、把 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Loss Distillation via Gradient Matching for Point Cloud Completion with Weighted Chamfer Distance はコメントを受け付けていません

MGS-SLAM: Monocular Sparse Tracking and Gaussian Mapping with Depth Smooth Regularization

要約 このレターでは、ガウス スプラッティングに基づく高密度視覚同時位置特定およ … 続きを読む

カテゴリー: cs.CV, cs.RO | MGS-SLAM: Monocular Sparse Tracking and Gaussian Mapping with Depth Smooth Regularization はコメントを受け付けていません