「cs.CV」カテゴリーアーカイブ

Spider: Any-to-Many Multimodal LLM

投稿日: 2025年4月8日作成者: jarxiv

要約マルチモーダルLLM（MLLM）は、大規模な言語モデル（LLM）の拡張とし … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Mapping biodiversity at very-high resolution in Europe

投稿日: 2025年4月8日作成者: jarxiv

要約このペーパーでは、ヨーロッパ全体の高解像度の生物多様性マッピングのためのカ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Federated Learning for Medical Image Classification: A Comprehensive Benchmark

投稿日: 2025年4月8日作成者: jarxiv

要約連邦学習パラダイムは、参加者のプライバシーを保護しながら、孤立した多施設デ … 続きを読む →

カテゴリー: cs.CV, cs.DC | コメントを受け付けていません

Texture2LoD3: Enabling LoD3 Building Reconstruction With Panoramic Images

投稿日: 2025年4月8日作成者: jarxiv

要約表面再構成の最近の進歩にもかかわらず、詳細レベル（LOD）3建物の再建は未 … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Contour Integration Underlies Human-Like Vision

投稿日: 2025年4月8日作成者: jarxiv

要約コンピュータービジョンにおける深い学習の大成功にもかかわらず、モデルはまだ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Explaining Low Perception Model Competency with High-Competency Counterfactuals

投稿日: 2025年4月8日作成者: jarxiv

要約画像分類モデルがその決定を生成する方法を説明する多くの方法が存在しますが、 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction

投稿日: 2025年4月8日作成者: jarxiv

要約データ表現の選択は、幾何学的なタスクにおける深い学習の成功における重要な要 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

TflosYOLO+TFSC: An Accurate and Robust Model for Estimating Flower Count and Flowering Period

投稿日: 2025年4月8日作成者: jarxiv

要約茶の花は、茶植物の分類学的研究とハイブリッド繁殖において重要な役割を果たし … 続きを読む →

カテゴリー: cs.CV, q-bio.QM | コメントを受け付けていません

From Sparse Signal to Smooth Motion: Real-Time Motion Generation with Rolling Prediction Models

投稿日: 2025年4月8日作成者: jarxiv

要約拡張現実（XR）では、ユーザーの全身動きを生成することは、自分の行動を理解 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

FetalCLIP: A Visual-Language Foundation Model for Fetal Ultrasound Image Analysis

投稿日: 2025年4月8日作成者: jarxiv

要約基礎モデルは、医療ドメインでますます効果的になりつつあり、下流のタスクに容 … 続きを読む →

カテゴリー: cs.AI, cs.CV, eess.IV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

Spider: Any-to-Many Multimodal LLM

Mapping biodiversity at very-high resolution in Europe

Federated Learning for Medical Image Classification: A Comprehensive Benchmark

Texture2LoD3: Enabling LoD3 Building Reconstruction With Panoramic Images

Contour Integration Underlies Human-Like Vision

Explaining Low Perception Model Competency with High-Competency Counterfactuals

DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction

TflosYOLO+TFSC: An Accurate and Robust Model for Estimating Flower Count and Flowering Period

From Sparse Signal to Smooth Motion: Real-Time Motion Generation with Rolling Prediction Models

FetalCLIP: A Visual-Language Foundation Model for Fetal Ultrasound Image Analysis

最近の投稿

最近のコメント

アーカイブ

カテゴリー