「cs.CV」カテゴリーアーカイブ

Unified Multimodal Understanding and Generation Models: Advances, Challenges, and Opportunities

投稿日: 2025年5月6日作成者: jarxiv

要約近年、マルチモーダル理解モデルと画像生成モデルの両方が目覚ましい進歩を遂げ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Geometric Knowledge-Guided Localized Global Distribution Alignment for Federated Learning

投稿日: 2025年5月6日作成者: jarxiv

要約連合学習におけるデータの不均一性は、局所分布と大域分布の間の著しい不整合に … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

RGBX-DiffusionDet: A Framework for Multi-Modal RGB-X Object Detection Using DiffusionDet

投稿日: 2025年5月6日作成者: jarxiv

要約 RGBX-DiffusionDetは、DiffusionDetモデルを拡張 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

GRAPHITE: Graph-Based Interpretable Tissue Examination for Enhanced Explainability in Breast Cancer Histopathology

投稿日: 2025年5月6日作成者: jarxiv

要約医療組織病理学における説明可能なAI（XAI）は、がん診断における深層学習 … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

DELTA: Dense Depth from Events and LiDAR using Transformer’s Attention

投稿日: 2025年5月6日作成者: jarxiv

要約イベントカメラとLiDARはそれぞれ、照明の変化の非同期検出と、一定速度で … 続きを読む →

カテゴリー: cs.CV, I.4.8 | コメントを受け付けていません

SiMHand: Mining Similar Hands for Large-Scale 3D Hand Pose Pre-training

投稿日: 2025年5月6日作成者: jarxiv

要約本論文では、SimHandと呼ばれる、類似した手の特徴を共有する野生の手画 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Detect, Classify, Act: Categorizing Industrial Anomalies with Multi-Modal Large Language Models

投稿日: 2025年5月6日作成者: jarxiv

要約最近の工業用視覚的異常検出の進歩により、高速な推論速度を維持しながら、異常 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

DeepSparse: A Foundation Model for Sparse-View CBCT Reconstruction

投稿日: 2025年5月6日作成者: jarxiv

要約コーンビームCT（CBCT）は、医療分野において重要な3次元画像技術である … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

MCCD: Multi-Agent Collaboration-based Compositional Diffusion for Complex Text-to-Image Generation

投稿日: 2025年5月6日作成者: jarxiv

要約拡散モデルは、テキストから画像への生成において優れた性能を示してきた。しか … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

FissionVAE: Federated Non-IID Image Generation with Latent Space and Decoder Decomposition

投稿日: 2025年5月6日作成者: jarxiv

要約連携学習は、分散化されたクライアントが、すべての学習データをローカルに保ち … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Unified Multimodal Understanding and Generation Models: Advances, Challenges, and Opportunities

Geometric Knowledge-Guided Localized Global Distribution Alignment for Federated Learning

RGBX-DiffusionDet: A Framework for Multi-Modal RGB-X Object Detection Using DiffusionDet

GRAPHITE: Graph-Based Interpretable Tissue Examination for Enhanced Explainability in Breast Cancer Histopathology

DELTA: Dense Depth from Events and LiDAR using Transformer’s Attention

SiMHand: Mining Similar Hands for Large-Scale 3D Hand Pose Pre-training

Detect, Classify, Act: Categorizing Industrial Anomalies with Multi-Modal Large Language Models

DeepSparse: A Foundation Model for Sparse-View CBCT Reconstruction

MCCD: Multi-Agent Collaboration-based Compositional Diffusion for Complex Text-to-Image Generation

FissionVAE: Federated Non-IID Image Generation with Latent Space and Decoder Decomposition

最近の投稿

最近のコメント

アーカイブ

カテゴリー