cs.CV」カテゴリーアーカイブ

Controllable retinal image synthesis using conditional StyleGAN and latent space manipulation for improved diagnosis and grading of diabetic retinopathy

要約 糖尿病性網膜症 (DR) は、網膜組織内の血管損傷を特徴とする糖尿病の結果 … 続きを読む

カテゴリー: cs.CV, eess.IV | Controllable retinal image synthesis using conditional StyleGAN and latent space manipulation for improved diagnosis and grading of diabetic retinopathy はコメントを受け付けていません

VLMEvalKit: An Open-Source Toolkit for Evaluating Large Multi-Modality Models

要約 私たちは、PyTorch に基づいた大規模なマルチモダリティ モデルを評価 … 続きを読む

カテゴリー: cs.CV | VLMEvalKit: An Open-Source Toolkit for Evaluating Large Multi-Modality Models はコメントを受け付けていません

Deep Neural Network-Based Sign Language Recognition: A Comprehensive Approach Using Transfer Learning with Explainability

要約 インクルージョンを促進し、主なコミュニケーション手段として手話に依存してい … 続きを読む

カテゴリー: cs.CV | Deep Neural Network-Based Sign Language Recognition: A Comprehensive Approach Using Transfer Learning with Explainability はコメントを受け付けていません

Physically Feasible Semantic Segmentation

要約 最先端のセマンティック セグメンテーション モデルは通常、データ駆動型の方 … 続きを読む

カテゴリー: cs.CV | Physically Feasible Semantic Segmentation はコメントを受け付けていません

RainMamba: Enhanced Locality Learning with State Space Models for Video Deraining

要約 屋外ビジョン システムは、雨筋や雨滴によって頻繁に汚染され、視覚タスクやマ … 続きを読む

カテゴリー: cs.CV | RainMamba: Enhanced Locality Learning with State Space Models for Video Deraining はコメントを受け付けていません

Adaptive Adapter Routing for Long-Tailed Class-Incremental Learning

要約 進化し続ける世界では、電子商取引プラットフォームのレビューなど、新しいデー … 続きを読む

カテゴリー: cs.CV, cs.LG | Adaptive Adapter Routing for Long-Tailed Class-Incremental Learning はコメントを受け付けていません

StereoCrafter: Diffusion-based Generation of Long and High-fidelity Stereoscopic 3D from Monocular Videos

要約 この論文では、没入型体験における 3D コンテンツの需要の高まりに対応し、 … 続きを読む

カテゴリー: cs.CV, cs.GR, I.3.0 | StereoCrafter: Diffusion-based Generation of Long and High-fidelity Stereoscopic 3D from Monocular Videos はコメントを受け付けていません

VMAS: Video-to-Music Generation via Semantic Alignment in Web Music Videos

要約 ビデオ入力から BGM を生成する方法を学習するためのフレームワークを紹介 … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | VMAS: Video-to-Music Generation via Semantic Alignment in Web Music Videos はコメントを受け付けていません

FreeEnhance: Tuning-Free Image Enhancement via Content-Consistent Noising-and-Denoising Process

要約 テキストから画像への生成モデルの出現により、後処理として実行される画像強調 … 続きを読む

カテゴリー: cs.CV, cs.MM | FreeEnhance: Tuning-Free Image Enhancement via Content-Consistent Noising-and-Denoising Process はコメントを受け付けていません

Hi3D: Pursuing High-Resolution Image-to-3D Generation with Video Diffusion Models

要約 画像から 3D への生成が大幅に進歩したにもかかわらず、既存の方法は、特に … 続きを読む

カテゴリー: cs.CV, cs.MM | Hi3D: Pursuing High-Resolution Image-to-3D Generation with Video Diffusion Models はコメントを受け付けていません