月別アーカイブ: 2024年2月

Real-World Atmospheric Turbulence Correction via Domain Adaptation

要約 日常生活でよく見られる現象である大気の乱流は、主に地表の不均一な加熱によっ … 続きを読む

カテゴリー: cs.CV, eess.IV | Real-World Atmospheric Turbulence Correction via Domain Adaptation はコメントを受け付けていません

Unsupervised Discovery of Object-Centric Neural Fields

要約 私たちは、単一の画像から 3D オブジェクト中心のシーン表現を推測すること … 続きを読む

カテゴリー: cs.CV | Unsupervised Discovery of Object-Centric Neural Fields はコメントを受け付けていません

Towards Calibrated Robust Fine-Tuning of Vision-Language Models

要約 堅牢な微調整は、配布外 (OOD) サンプルでのパフォーマンスを確保するこ … 続きを読む

カテゴリー: cs.AI, cs.CV | Towards Calibrated Robust Fine-Tuning of Vision-Language Models はコメントを受け付けていません

Exploring Perceptual Limitation of Multimodal Large Language Models

要約 マルチモーダル大規模言語モデル (MLLM) は最近、視覚的な質問に答える … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Exploring Perceptual Limitation of Multimodal Large Language Models はコメントを受け付けていません

Make it more specific: A novel uncertainty based airway segmentation application on 3D U-Net and its variants

要約 最も正確な予測モデルを取得できるように、各医療セグメンテーション タスクは … 続きを読む

カテゴリー: cs.CV, eess.IV | Make it more specific: A novel uncertainty based airway segmentation application on 3D U-Net and its variants はコメントを受け付けていません

Towards Perceiving Small Visual Details in Zero-shot Visual Question Answering with Multimodal LLMs

要約 マルチモーダル大規模言語モデル (MLLM) は最近、ビジュアル質問応答 … 続きを読む

カテゴリー: cs.CL, cs.CV | Towards Perceiving Small Visual Details in Zero-shot Visual Question Answering with Multimodal LLMs はコメントを受け付けていません

A Closer Look at the Robustness of Contrastive Language-Image Pre-Training (CLIP)

要約 Contrastive Language-Image Pre-traini … 続きを読む

カテゴリー: cs.CV, cs.LG | A Closer Look at the Robustness of Contrastive Language-Image Pre-Training (CLIP) はコメントを受け付けていません

Context-aware Multi-Model Object Detection for Diversely Heterogeneous Compute Systems

要約 近年、ディープ ニューラル ネットワーク (DNN) は、特に自律システム … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO | Context-aware Multi-Model Object Detection for Diversely Heterogeneous Compute Systems はコメントを受け付けていません

An Empirical Study Into What Matters for Calibrating Vision-Language Models

要約 ビジョン言語モデル (VLM) は、ゼロショット認識の主要なアプローチとし … 続きを読む

カテゴリー: cs.CV, cs.LG | An Empirical Study Into What Matters for Calibrating Vision-Language Models はコメントを受け付けていません

Novel definition and quantitative analysis of branch structure with topological data analysis

要約 分岐ネットワーク構造は自然界に数多く存在しますが、既存の定量的手法は分岐構 … 続きを読む

カテゴリー: cs.CG, cs.CV, math.AT, q-bio.QM | Novel definition and quantitative analysis of branch structure with topological data analysis はコメントを受け付けていません