月別アーカイブ: 2025年3月

VILA-U: a Unified Foundation Model Integrating Visual Understanding and Generation

要約 Vila-Uは、ビデオ、画像、言語の理解、および生成を統合する統合された基 … 続きを読む

カテゴリー: cs.CV, cs.LG | VILA-U: a Unified Foundation Model Integrating Visual Understanding and Generation はコメントを受け付けていません

Undertrained Image Reconstruction for Realistic Degradation in Blind Image Super-Resolution

要約 ほとんどの超解像度(SR)モデルは、実際の低解像度(LR)画像と格闘してい … 続きを読む

カテゴリー: cs.CV, eess.IV | Undertrained Image Reconstruction for Realistic Degradation in Blind Image Super-Resolution はコメントを受け付けていません

Exploring Advanced Techniques for Visual Question Answering: A Comprehensive Comparison

要約 視覚的な質問応答(VQA)は、コンピュータービジョンと自然言語処理の交差点 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.ET, cs.LG | Exploring Advanced Techniques for Visual Question Answering: A Comprehensive Comparison はコメントを受け付けていません

Efficient Connectivity-Preserving Instance Segmentation with Supervoxel-Based Loss Function

要約 ニューロンとその長距離投影軸索の複雑な局所形態を再構築すると、神経科学にお … 続きを読む

カテゴリー: cs.CV, q-bio.NC | Efficient Connectivity-Preserving Instance Segmentation with Supervoxel-Based Loss Function はコメントを受け付けていません

A Causal Framework for Aligning Image Quality Metrics and Deep Neural Network Robustness

要約 画質は、深いニューラルネットワーク(DNNS)のパフォーマンスにおいて重要 … 続きを読む

カテゴリー: cs.AI, cs.CV | A Causal Framework for Aligning Image Quality Metrics and Deep Neural Network Robustness はコメントを受け付けていません

MX-Font++: Mixture of Heterogeneous Aggregation Experts for Few-shot Font Generation

要約 少数のフォント生成(FFG)は、限られた参照グリフを使用して新しいフォント … 続きを読む

カテゴリー: cs.CV | MX-Font++: Mixture of Heterogeneous Aggregation Experts for Few-shot Font Generation はコメントを受け付けていません

Robust Long-Range Perception Against Sensor Misalignment in Autonomous Vehicles

要約 センサー融合の機械学習アルゴリズムの進歩により、他の道路利用者の検出と予測 … 続きを読む

カテゴリー: cs.CV | Robust Long-Range Perception Against Sensor Misalignment in Autonomous Vehicles はコメントを受け付けていません

EC-DIT: Scaling Diffusion Transformers with Adaptive Expert-Choice Routing

要約 拡散トランスは、テキスト間合成に広く採用されています。 これらのモデルを数 … 続きを読む

カテゴリー: cs.CV, cs.LG | EC-DIT: Scaling Diffusion Transformers with Adaptive Expert-Choice Routing はコメントを受け付けていません

AI-based association analysis for medical imaging using latent-space geometric confounder correction

要約 この研究では、人工知能ベースの医療画像分析における交絡効果と解釈可能性の課 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | AI-based association analysis for medical imaging using latent-space geometric confounder correction はコメントを受け付けていません

Developing a PET/CT Foundation Model for Cross-Modal Anatomical and Functional Imaging

要約 腫瘍学では、CTからの解剖学的詳細とPETからの分子マーカー発現情報との解 … 続きを読む

カテゴリー: cs.AI, cs.CV | Developing a PET/CT Foundation Model for Cross-Modal Anatomical and Functional Imaging はコメントを受け付けていません