cs.CV」カテゴリーアーカイブ

FIRAL: An Active Learning Algorithm for Multinomial Logistic Regression

要約 私たちは、多項ロジスティック回帰を使用したマルチクラス分類のためのプールベ … 続きを読む

カテゴリー: cs.CV, cs.LG | FIRAL: An Active Learning Algorithm for Multinomial Logistic Regression はコメントを受け付けていません

DreamMapping: High-Fidelity Text-to-3D Generation via Variational Distribution Mapping

要約 スコア蒸留サンプリング (SDS) は、テキストから 3D への生成のため … 続きを読む

カテゴリー: cs.CV, cs.GR, I.3.6 | DreamMapping: High-Fidelity Text-to-3D Generation via Variational Distribution Mapping はコメントを受け付けていません

MCTR: Multi Camera Tracking Transformer

要約 マルチカメラ追跡は、現実世界のさまざまなアプリケーションで極めて重要な役割 … 続きを読む

カテゴリー: cs.CV | MCTR: Multi Camera Tracking Transformer はコメントを受け付けていません

Using ResNet to Utilize 4-class T2-FLAIR Slice Classification Based on the Cholinergic Pathways Hyperintensities Scale for Pathological Aging

要約 コリン作動性経路高信号スケール (CHIPS) は、T2-FLAIR 画像 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Using ResNet to Utilize 4-class T2-FLAIR Slice Classification Based on the Cholinergic Pathways Hyperintensities Scale for Pathological Aging はコメントを受け付けていません

What to align in multimodal contrastive learning?

要約 人間は多感覚の統合を通じて世界を認識し、さまざまなモダリティの情報をブレン … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG | What to align in multimodal contrastive learning? はコメントを受け付けていません

NVRC: Neural Video Representation Compression

要約 暗黙的ニューラル表現 (INR) ベースのビデオ コーディングの最近の進歩 … 続きを読む

カテゴリー: cs.CV, eess.IV | NVRC: Neural Video Representation Compression はコメントを受け付けていません

Efficient One-Step Diffusion Refinement for Snapshot Compressive Imaging

要約 コード化開口スナップショット スペクトル イメージング (CASSI) は … 続きを読む

カテゴリー: cs.CV, eess.IV | Efficient One-Step Diffusion Refinement for Snapshot Compressive Imaging はコメントを受け付けていません

Controllable retinal image synthesis using conditional StyleGAN and latent space manipulation for improved diagnosis and grading of diabetic retinopathy

要約 糖尿病性網膜症 (DR) は、網膜組織内の血管損傷を特徴とする糖尿病の結果 … 続きを読む

カテゴリー: cs.CV, eess.IV | Controllable retinal image synthesis using conditional StyleGAN and latent space manipulation for improved diagnosis and grading of diabetic retinopathy はコメントを受け付けていません

VLMEvalKit: An Open-Source Toolkit for Evaluating Large Multi-Modality Models

要約 私たちは、PyTorch に基づいた大規模なマルチモダリティ モデルを評価 … 続きを読む

カテゴリー: cs.CV | VLMEvalKit: An Open-Source Toolkit for Evaluating Large Multi-Modality Models はコメントを受け付けていません

Deep Neural Network-Based Sign Language Recognition: A Comprehensive Approach Using Transfer Learning with Explainability

要約 インクルージョンを促進し、主なコミュニケーション手段として手話に依存してい … 続きを読む

カテゴリー: cs.CV | Deep Neural Network-Based Sign Language Recognition: A Comprehensive Approach Using Transfer Learning with Explainability はコメントを受け付けていません