「cs.CV」カテゴリーアーカイブ

VGR: Visual Grounded Reasoning

投稿日: 2025年6月16日作成者: jarxiv

要約マルチモーダルの考え方（COT）の推論の分野では、既存のアプローチは主に言 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

Improving Surgical Risk Prediction Through Integrating Automated Body Composition Analysis: a Retrospective Trial on Colectomy Surgery

投稿日: 2025年6月16日作成者: jarxiv

要約目的：CTスキャンから術前の体組成メトリックが自動的に抽出されたかどうかを … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

crossMoDA Challenge: Evolution of Cross-Modality Domain Adaptation Techniques for Vestibular Schwannoma and Cochlea Segmentation from 2021 to 2023

投稿日: 2025年6月16日作成者: jarxiv

要約医療画像コンピューティングとコンピューター支援介入（MICCAI）に関する … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

SIMSHIFT: A Benchmark for Adapting Neural Surrogates to Distribution Shifts

投稿日: 2025年6月16日作成者: jarxiv

要約部分的な微分方程式（PDE）の神経代理人は、新しい材料の種類や構造的次元な … 続きを読む →

カテゴリー: cs.CV, cs.LG, physics.comp-ph | コメントを受け付けていません

Affogato: Learning Open-Vocabulary Affordance Grounding with Automated Data Generation at Scale

投稿日: 2025年6月16日作成者: jarxiv

要約相互作用の自然言語の説明に基づいたアフォーダンス接地局在オブジェクト領域 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

EMLoC: Emulator-based Memory-efficient Fine-tuning with LoRA Correction

投稿日: 2025年6月16日作成者: jarxiv

要約オープンソースの基礎モデルでは、迅速な採用と開発が見られ、多様なドメイン全 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

PiPViT: Patch-based Visual Interpretable Prototypes for Retinal Image Analysis

投稿日: 2025年6月16日作成者: jarxiv

要約背景と目的：プロトタイプベースの方法は、細粒のパートプロトタイプを学習する … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

PhysNav-DG: A Novel Adaptive Framework for Robust VLM-Sensor Fusion in Navigation Applications

投稿日: 2025年6月16日作成者: jarxiv

要約多様な環境とドメインでの堅牢なナビゲーションには、正確な状態推定と透明な意 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM, cs.RO | コメントを受け付けていません

IQE-CLIP: Instance-aware Query Embedding for Zero-/Few-shot Anomaly Detection in Medical Domain

投稿日: 2025年6月16日作成者: jarxiv

要約最近、クリップなどのビジョン言語モデルの急速な進歩は、ゼロ/少ないショット … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

MMMG: A Massive, Multidisciplinary, Multi-Tier Generation Benchmark for Text-to-Image Reasoning

投稿日: 2025年6月16日作成者: jarxiv

要約このホワイトペーパーでは、画像生成モデルの推論能力を調査するために、大規模 … 続きを読む →

カテゴリー: cs.CL, cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

VGR: Visual Grounded Reasoning

Improving Surgical Risk Prediction Through Integrating Automated Body Composition Analysis: a Retrospective Trial on Colectomy Surgery

crossMoDA Challenge: Evolution of Cross-Modality Domain Adaptation Techniques for Vestibular Schwannoma and Cochlea Segmentation from 2021 to 2023

SIMSHIFT: A Benchmark for Adapting Neural Surrogates to Distribution Shifts

Affogato: Learning Open-Vocabulary Affordance Grounding with Automated Data Generation at Scale

EMLoC: Emulator-based Memory-efficient Fine-tuning with LoRA Correction

PiPViT: Patch-based Visual Interpretable Prototypes for Retinal Image Analysis

PhysNav-DG: A Novel Adaptive Framework for Robust VLM-Sensor Fusion in Navigation Applications

IQE-CLIP: Instance-aware Query Embedding for Zero-/Few-shot Anomaly Detection in Medical Domain

MMMG: A Massive, Multidisciplinary, Multi-Tier Generation Benchmark for Text-to-Image Reasoning

最近の投稿

最近のコメント

アーカイブ

カテゴリー