cs.CV」カテゴリーアーカイブ

Video-XL: Extra-Long Vision Language Model for Hour-Scale Video Understanding

要約 現在のマルチモーダル大規模言語モデル (MLLM) はビデオ理解において有 … 続きを読む

カテゴリー: cs.CV | Video-XL: Extra-Long Vision Language Model for Hour-Scale Video Understanding はコメントを受け付けていません

Less is More: Selective Reduction of CT Data for Self-Supervised Pre-Training of Deep Learning Models with Contrastive Learning Improves Downstream Classification Performance

要約 対照学習を使用した深層学習モデルの自己教師あり事前トレーニングは、画像分析 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | Less is More: Selective Reduction of CT Data for Self-Supervised Pre-Training of Deep Learning Models with Contrastive Learning Improves Downstream Classification Performance はコメントを受け付けていません

A Hybrid Feature Fusion Deep Learning Framework for Leukemia Cancer Detection in Microscopic Blood Sample Using Gated Recurrent Unit and Uncertainty Quantification

要約 急性リンパ芽球性白血病 (ALL) は、白血病の中で最も悪性度が高く、成人 … 続きを読む

カテゴリー: cs.CV, eess.IV | A Hybrid Feature Fusion Deep Learning Framework for Leukemia Cancer Detection in Microscopic Blood Sample Using Gated Recurrent Unit and Uncertainty Quantification はコメントを受け付けていません

Multi-modal Pose Diffuser: A Multimodal Generative Conditional Pose Prior

要約 スキン付きマルチパーソン線形 (SMPL) モデルは、3D 人間の姿勢推定 … 続きを読む

カテゴリー: cs.CV | Multi-modal Pose Diffuser: A Multimodal Generative Conditional Pose Prior はコメントを受け付けていません

Fundus to Fluorescein Angiography Video Generation as a Retinal Generative Foundation Model

要約 フルオレセイン眼底血管造影法 (FFA) は、網膜血管の問題の診断とモニタ … 続きを読む

カテゴリー: cs.CV | Fundus to Fluorescein Angiography Video Generation as a Retinal Generative Foundation Model はコメントを受け付けていません

MomentumSMoE: Integrating Momentum into Sparse Mixture of Experts

要約 Sparse Mixture of Experts (SMoE) は、ディ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, stat.ML | MomentumSMoE: Integrating Momentum into Sparse Mixture of Experts はコメントを受け付けていません

Scalable Drift Monitoring in Medical Imaging AI

要約 医療画像への人工知能 (AI) の統合により、臨床診断は高度化しましたが、 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Scalable Drift Monitoring in Medical Imaging AI はコメントを受け付けていません

IncEventGS: Pose-Free Gaussian Splatting from a Single Event Camera

要約 新しいビュー合成のための暗黙的ニューラル表現と明示的 3D ガウス スプラ … 続きを読む

カテゴリー: cs.CV | IncEventGS: Pose-Free Gaussian Splatting from a Single Event Camera はコメントを受け付けていません

Harnessing Shared Relations via Multimodal Mixup Contrastive Learning for Multimodal Classification

要約 深層マルチモーダル学習は、対照学習を活用してモダリティ間の明示的な 1 対 … 続きを読む

カテゴリー: cs.AI, cs.CV | Harnessing Shared Relations via Multimodal Mixup Contrastive Learning for Multimodal Classification はコメントを受け付けていません

Movie101v2: Improved Movie Narration Benchmark

要約 自動映画ナレーションは、視覚障害のある視聴者を支援するために、ビデオに合わ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.MM | Movie101v2: Improved Movie Narration Benchmark はコメントを受け付けていません