cs.CV」カテゴリーアーカイブ

Physically Feasible Semantic Segmentation

要約 最先端のセマンティック セグメンテーション モデルは通常、データ駆動型の方 … 続きを読む

カテゴリー: cs.CV | Physically Feasible Semantic Segmentation はコメントを受け付けていません

RainMamba: Enhanced Locality Learning with State Space Models for Video Deraining

要約 屋外ビジョン システムは、雨筋や雨滴によって頻繁に汚染され、視覚タスクやマ … 続きを読む

カテゴリー: cs.CV | RainMamba: Enhanced Locality Learning with State Space Models for Video Deraining はコメントを受け付けていません

Adaptive Adapter Routing for Long-Tailed Class-Incremental Learning

要約 進化し続ける世界では、電子商取引プラットフォームのレビューなど、新しいデー … 続きを読む

カテゴリー: cs.CV, cs.LG | Adaptive Adapter Routing for Long-Tailed Class-Incremental Learning はコメントを受け付けていません

StereoCrafter: Diffusion-based Generation of Long and High-fidelity Stereoscopic 3D from Monocular Videos

要約 この論文では、没入型体験における 3D コンテンツの需要の高まりに対応し、 … 続きを読む

カテゴリー: cs.CV, cs.GR, I.3.0 | StereoCrafter: Diffusion-based Generation of Long and High-fidelity Stereoscopic 3D from Monocular Videos はコメントを受け付けていません

VMAS: Video-to-Music Generation via Semantic Alignment in Web Music Videos

要約 ビデオ入力から BGM を生成する方法を学習するためのフレームワークを紹介 … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | VMAS: Video-to-Music Generation via Semantic Alignment in Web Music Videos はコメントを受け付けていません

FreeEnhance: Tuning-Free Image Enhancement via Content-Consistent Noising-and-Denoising Process

要約 テキストから画像への生成モデルの出現により、後処理として実行される画像強調 … 続きを読む

カテゴリー: cs.CV, cs.MM | FreeEnhance: Tuning-Free Image Enhancement via Content-Consistent Noising-and-Denoising Process はコメントを受け付けていません

Hi3D: Pursuing High-Resolution Image-to-3D Generation with Video Diffusion Models

要約 画像から 3D への生成が大幅に進歩したにもかかわらず、既存の方法は、特に … 続きを読む

カテゴリー: cs.CV, cs.MM | Hi3D: Pursuing High-Resolution Image-to-3D Generation with Video Diffusion Models はコメントを受け付けていません

DreamMesh: Jointly Manipulating and Texturing Triangle Meshes for Text-to-3D Generation

要約 強力な 2D 拡散モデルを使用した放射輝度フィールド (NeRF) の学習 … 続きを読む

カテゴリー: cs.CV, cs.MM | DreamMesh: Jointly Manipulating and Texturing Triangle Meshes for Text-to-3D Generation はコメントを受け付けていません

Self-Evolving Depth-Supervised 3D Gaussian Splatting from Rendered Stereo Pairs

要約 3D ガウス スプラッティング (GS) は、基礎となる 3D シーン ジ … 続きを読む

カテゴリー: cs.CV | Self-Evolving Depth-Supervised 3D Gaussian Splatting from Rendered Stereo Pairs はコメントを受け付けていません

EyeCLIP: A visual-language foundation model for multi-modal ophthalmic image analysis

要約 緑内障、黄斑変性症、糖尿病性網膜症などの眼疾患を早期に発見することは、視力 … 続きを読む

カテゴリー: cs.AI, cs.CV | EyeCLIP: A visual-language foundation model for multi-modal ophthalmic image analysis はコメントを受け付けていません