cs.CV」カテゴリーアーカイブ

Spider: Any-to-Many Multimodal LLM

要約 マルチモーダルLLM(MLLM)は、大規模な言語モデル(LLM)の拡張とし … 続きを読む

カテゴリー: cs.CV | Spider: Any-to-Many Multimodal LLM はコメントを受け付けていません

Mapping biodiversity at very-high resolution in Europe

要約 このペーパーでは、ヨーロッパ全体の高解像度の生物多様性マッピングのためのカ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Mapping biodiversity at very-high resolution in Europe はコメントを受け付けていません

Federated Learning for Medical Image Classification: A Comprehensive Benchmark

要約 連邦学習パラダイムは、参加者のプライバシーを保護しながら、孤立した多施設デ … 続きを読む

カテゴリー: cs.CV, cs.DC | Federated Learning for Medical Image Classification: A Comprehensive Benchmark はコメントを受け付けていません

Texture2LoD3: Enabling LoD3 Building Reconstruction With Panoramic Images

要約 表面再構成の最近の進歩にもかかわらず、詳細レベル(LOD)3建物の再建は未 … 続きを読む

カテゴリー: cs.CV, cs.LG | Texture2LoD3: Enabling LoD3 Building Reconstruction With Panoramic Images はコメントを受け付けていません

Contour Integration Underlies Human-Like Vision

要約 コンピュータービジョンにおける深い学習の大成功にもかかわらず、モデルはまだ … 続きを読む

カテゴリー: cs.CV | Contour Integration Underlies Human-Like Vision はコメントを受け付けていません

Explaining Low Perception Model Competency with High-Competency Counterfactuals

要約 画像分類モデルがその決定を生成する方法を説明する多くの方法が存在しますが、 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Explaining Low Perception Model Competency with High-Competency Counterfactuals はコメントを受け付けていません

DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction

要約 データ表現の選択は、幾何学的なタスクにおける深い学習の成功における重要な要 … 続きを読む

カテゴリー: cs.CV | DualPM: Dual Posed-Canonical Point Maps for 3D Shape and Pose Reconstruction はコメントを受け付けていません

TflosYOLO+TFSC: An Accurate and Robust Model for Estimating Flower Count and Flowering Period

要約 茶の花は、茶植物の分類学的研究とハイブリッド繁殖において重要な役割を果たし … 続きを読む

カテゴリー: cs.CV, q-bio.QM | TflosYOLO+TFSC: An Accurate and Robust Model for Estimating Flower Count and Flowering Period はコメントを受け付けていません

From Sparse Signal to Smooth Motion: Real-Time Motion Generation with Rolling Prediction Models

要約 拡張現実(XR)では、ユーザーの全身動きを生成することは、自分の行動を理解 … 続きを読む

カテゴリー: cs.CV | From Sparse Signal to Smooth Motion: Real-Time Motion Generation with Rolling Prediction Models はコメントを受け付けていません

FetalCLIP: A Visual-Language Foundation Model for Fetal Ultrasound Image Analysis

要約 基礎モデルは、医療ドメインでますます効果的になりつつあり、下流のタスクに容 … 続きを読む

カテゴリー: cs.AI, cs.CV, eess.IV | FetalCLIP: A Visual-Language Foundation Model for Fetal Ultrasound Image Analysis はコメントを受け付けていません