cs.CV」カテゴリーアーカイブ

What to align in multimodal contrastive learning?

要約 人間は多感覚の統合を通じて世界を認識し、さまざまなモダリティの情報をブレン … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | What to align in multimodal contrastive learning? はコメントを受け付けていません

NVRC: Neural Video Representation Compression

要約 暗黙的ニューラル表現 (INR) ベースのビデオ コーディングの最近の進歩 … 続きを読む

カテゴリー: cs.CV, eess.IV | NVRC: Neural Video Representation Compression はコメントを受け付けていません

Efficient One-Step Diffusion Refinement for Snapshot Compressive Imaging

要約 コード化開口スナップショット スペクトル イメージング (CASSI) は … 続きを読む

カテゴリー: cs.CV, eess.IV | Efficient One-Step Diffusion Refinement for Snapshot Compressive Imaging はコメントを受け付けていません

Controllable retinal image synthesis using conditional StyleGAN and latent space manipulation for improved diagnosis and grading of diabetic retinopathy

要約 糖尿病性網膜症 (DR) は、網膜組織内の血管損傷を特徴とする糖尿病の結果 … 続きを読む

カテゴリー: cs.CV, eess.IV | Controllable retinal image synthesis using conditional StyleGAN and latent space manipulation for improved diagnosis and grading of diabetic retinopathy はコメントを受け付けていません

VLMEvalKit: An Open-Source Toolkit for Evaluating Large Multi-Modality Models

要約 私たちは、PyTorch に基づいた大規模なマルチモダリティ モデルを評価 … 続きを読む

カテゴリー: cs.CV | VLMEvalKit: An Open-Source Toolkit for Evaluating Large Multi-Modality Models はコメントを受け付けていません

Deep Neural Network-Based Sign Language Recognition: A Comprehensive Approach Using Transfer Learning with Explainability

要約 インクルージョンを促進し、主なコミュニケーション手段として手話に依存してい … 続きを読む

カテゴリー: cs.CV | Deep Neural Network-Based Sign Language Recognition: A Comprehensive Approach Using Transfer Learning with Explainability はコメントを受け付けていません

Physically Feasible Semantic Segmentation

要約 最先端のセマンティック セグメンテーション モデルは通常、データ駆動型の方 … 続きを読む

カテゴリー: cs.CV | Physically Feasible Semantic Segmentation はコメントを受け付けていません

RainMamba: Enhanced Locality Learning with State Space Models for Video Deraining

要約 屋外ビジョン システムは、雨筋や雨滴によって頻繁に汚染され、視覚タスクやマ … 続きを読む

カテゴリー: cs.CV | RainMamba: Enhanced Locality Learning with State Space Models for Video Deraining はコメントを受け付けていません

Adaptive Adapter Routing for Long-Tailed Class-Incremental Learning

要約 進化し続ける世界では、電子商取引プラットフォームのレビューなど、新しいデー … 続きを読む

カテゴリー: cs.CV, cs.LG | Adaptive Adapter Routing for Long-Tailed Class-Incremental Learning はコメントを受け付けていません

StereoCrafter: Diffusion-based Generation of Long and High-fidelity Stereoscopic 3D from Monocular Videos

要約 この論文では、没入型体験における 3D コンテンツの需要の高まりに対応し、 … 続きを読む

カテゴリー: cs.CV, cs.GR, I.3.0 | StereoCrafter: Diffusion-based Generation of Long and High-fidelity Stereoscopic 3D from Monocular Videos はコメントを受け付けていません