月別アーカイブ: 2025年3月

VILA-U: a Unified Foundation Model Integrating Visual Understanding and Generation

投稿日: 2025年3月5日作成者: jarxiv

要約 Vila-Uは、ビデオ、画像、言語の理解、および生成を統合する統合された基 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Undertrained Image Reconstruction for Realistic Degradation in Blind Image Super-Resolution

投稿日: 2025年3月5日作成者: jarxiv

要約ほとんどの超解像度（SR）モデルは、実際の低解像度（LR）画像と格闘してい … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Exploring Advanced Techniques for Visual Question Answering: A Comprehensive Comparison

投稿日: 2025年3月5日作成者: jarxiv

要約視覚的な質問応答（VQA）は、コンピュータービジョンと自然言語処理の交差点 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.ET, cs.LG | コメントを受け付けていません

Efficient Connectivity-Preserving Instance Segmentation with Supervoxel-Based Loss Function

投稿日: 2025年3月5日作成者: jarxiv

要約ニューロンとその長距離投影軸索の複雑な局所形態を再構築すると、神経科学にお … 続きを読む →

カテゴリー: cs.CV, q-bio.NC | コメントを受け付けていません

A Causal Framework for Aligning Image Quality Metrics and Deep Neural Network Robustness

投稿日: 2025年3月5日作成者: jarxiv

要約画質は、深いニューラルネットワーク（DNNS）のパフォーマンスにおいて重要 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

MX-Font++: Mixture of Heterogeneous Aggregation Experts for Few-shot Font Generation

投稿日: 2025年3月5日作成者: jarxiv

要約少数のフォント生成（FFG）は、限られた参照グリフを使用して新しいフォント … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Robust Long-Range Perception Against Sensor Misalignment in Autonomous Vehicles

投稿日: 2025年3月5日作成者: jarxiv

要約センサー融合の機械学習アルゴリズムの進歩により、他の道路利用者の検出と予測 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

EC-DIT: Scaling Diffusion Transformers with Adaptive Expert-Choice Routing

投稿日: 2025年3月5日作成者: jarxiv

要約拡散トランスは、テキスト間合成に広く採用されています。これらのモデルを数 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

AI-based association analysis for medical imaging using latent-space geometric confounder correction

投稿日: 2025年3月5日作成者: jarxiv

要約この研究では、人工知能ベースの医療画像分析における交絡効果と解釈可能性の課 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Developing a PET/CT Foundation Model for Cross-Modal Anatomical and Functional Imaging

投稿日: 2025年3月5日作成者: jarxiv

要約腫瘍学では、CTからの解剖学的詳細とPETからの分子マーカー発現情報との解 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

月別アーカイブ: 2025年3月

VILA-U: a Unified Foundation Model Integrating Visual Understanding and Generation

Undertrained Image Reconstruction for Realistic Degradation in Blind Image Super-Resolution

Exploring Advanced Techniques for Visual Question Answering: A Comprehensive Comparison

Efficient Connectivity-Preserving Instance Segmentation with Supervoxel-Based Loss Function

A Causal Framework for Aligning Image Quality Metrics and Deep Neural Network Robustness

MX-Font++: Mixture of Heterogeneous Aggregation Experts for Few-shot Font Generation

Robust Long-Range Perception Against Sensor Misalignment in Autonomous Vehicles

EC-DIT: Scaling Diffusion Transformers with Adaptive Expert-Choice Routing

AI-based association analysis for medical imaging using latent-space geometric confounder correction

Developing a PET/CT Foundation Model for Cross-Modal Anatomical and Functional Imaging

最近の投稿

最近のコメント

アーカイブ

カテゴリー