cs.CV」カテゴリーアーカイブ

VGR: Visual Grounded Reasoning

要約 マルチモーダルの考え方(COT)の推論の分野では、既存のアプローチは主に言 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | VGR: Visual Grounded Reasoning はコメントを受け付けていません

Improving Surgical Risk Prediction Through Integrating Automated Body Composition Analysis: a Retrospective Trial on Colectomy Surgery

要約 目的:CTスキャンから術前の体組成メトリックが自動的に抽出されたかどうかを … 続きを読む

カテゴリー: cs.CV | Improving Surgical Risk Prediction Through Integrating Automated Body Composition Analysis: a Retrospective Trial on Colectomy Surgery はコメントを受け付けていません

crossMoDA Challenge: Evolution of Cross-Modality Domain Adaptation Techniques for Vestibular Schwannoma and Cochlea Segmentation from 2021 to 2023

要約 医療画像コンピューティングとコンピューター支援介入(MICCAI)に関する … 続きを読む

カテゴリー: cs.CV, eess.IV | crossMoDA Challenge: Evolution of Cross-Modality Domain Adaptation Techniques for Vestibular Schwannoma and Cochlea Segmentation from 2021 to 2023 はコメントを受け付けていません

SIMSHIFT: A Benchmark for Adapting Neural Surrogates to Distribution Shifts

要約 部分的な微分方程式(PDE)の神経代理人は、新しい材料の種類や構造的次元な … 続きを読む

カテゴリー: cs.CV, cs.LG, physics.comp-ph | SIMSHIFT: A Benchmark for Adapting Neural Surrogates to Distribution Shifts はコメントを受け付けていません

Affogato: Learning Open-Vocabulary Affordance Grounding with Automated Data Generation at Scale

要約 相互作用の自然言語の説明に基づいたアフォーダンス接地局在オブジェクト領域 … 続きを読む

カテゴリー: cs.CV | Affogato: Learning Open-Vocabulary Affordance Grounding with Automated Data Generation at Scale はコメントを受け付けていません

EMLoC: Emulator-based Memory-efficient Fine-tuning with LoRA Correction

要約 オープンソースの基礎モデルでは、迅速な採用と開発が見られ、多様なドメイン全 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | EMLoC: Emulator-based Memory-efficient Fine-tuning with LoRA Correction はコメントを受け付けていません

PiPViT: Patch-based Visual Interpretable Prototypes for Retinal Image Analysis

要約 背景と目的:プロトタイプベースの方法は、細粒のパートプロトタイプを学習する … 続きを読む

カテゴリー: cs.AI, cs.CV | PiPViT: Patch-based Visual Interpretable Prototypes for Retinal Image Analysis はコメントを受け付けていません

PhysNav-DG: A Novel Adaptive Framework for Robust VLM-Sensor Fusion in Navigation Applications

要約 多様な環境とドメインでの堅牢なナビゲーションには、正確な状態推定と透明な意 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM, cs.RO | PhysNav-DG: A Novel Adaptive Framework for Robust VLM-Sensor Fusion in Navigation Applications はコメントを受け付けていません

IQE-CLIP: Instance-aware Query Embedding for Zero-/Few-shot Anomaly Detection in Medical Domain

要約 最近、クリップなどのビジョン言語モデルの急速な進歩は、ゼロ/少ないショット … 続きを読む

カテゴリー: cs.CV | IQE-CLIP: Instance-aware Query Embedding for Zero-/Few-shot Anomaly Detection in Medical Domain はコメントを受け付けていません

MMMG: A Massive, Multidisciplinary, Multi-Tier Generation Benchmark for Text-to-Image Reasoning

要約 このホワイトペーパーでは、画像生成モデルの推論能力を調査するために、大規模 … 続きを読む

カテゴリー: cs.CL, cs.CV | MMMG: A Massive, Multidisciplinary, Multi-Tier Generation Benchmark for Text-to-Image Reasoning はコメントを受け付けていません