投稿者「jarxiv」のアーカイブ

VLM Can Be a Good Assistant: Enhancing Embodied Visual Tracking with Self-Improving Vision-Language Models

要約 環境視覚モデル(VLM)を使用して具体化された視覚追跡(EVT)を強化する … 続きを読む

カテゴリー: cs.AI, cs.CV | VLM Can Be a Good Assistant: Enhancing Embodied Visual Tracking with Self-Improving Vision-Language Models はコメントを受け付けていません

Structurally Different Neural Network Blocks for the Segmentation of Atrial and Aortic Perivascular Adipose Tissue in Multi-centre CT Angiography Scans

要約 畳み込みニューラルネットワーク(CNNS)の出現以来、視覚変圧器(VITS … 続きを読む

カテゴリー: cs.CV, eess.IV | Structurally Different Neural Network Blocks for the Segmentation of Atrial and Aortic Perivascular Adipose Tissue in Multi-centre CT Angiography Scans はコメントを受け付けていません

Surf2CT: Cascaded 3D Flow Matching Models for Torso 3D CT Synthesis from Skin Surface

要約 外部表面スキャンと単純な人口統計データ(年齢、性別、身長、体重)からのヒト … 続きを読む

カテゴリー: cs.CV, eess.IV | Surf2CT: Cascaded 3D Flow Matching Models for Torso 3D CT Synthesis from Skin Surface はコメントを受け付けていません

PathFL: Multi-Alignment Federated Learning for Pathology Image Segmentation

要約 複数のセンター全体での病理学の画像セグメンテーションは、イメージングモダリ … 続きを読む

カテゴリー: cs.CV | PathFL: Multi-Alignment Federated Learning for Pathology Image Segmentation はコメントを受け付けていません

PrismLayers: Open Data for High-Quality Multi-Layer Transparent Image Generative Models

要約 テキストプロンプトから高品質の多層透明な画像を生成すると、新しいレベルのク … 続きを読む

カテゴリー: cs.CV | PrismLayers: Open Data for High-Quality Multi-Layer Transparent Image Generative Models はコメントを受け付けていません

Thinking with Generated Images

要約 生成された画像で思考を提示します。これは、中間視覚的思考ステップの自発的な … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | Thinking with Generated Images はコメントを受け付けていません

RiverMamba: A State Space Model for Global River Discharge and Flood Forecasting

要約 河川排出予測の最近の深い学習アプローチにより、洪水予測の精度と効率が向上し … 続きを読む

カテゴリー: cs.CV, cs.LG | RiverMamba: A State Space Model for Global River Discharge and Flood Forecasting はコメントを受け付けていません

Scaling-up Perceptual Video Quality Assessment

要約 データスケーリング法は、さまざまな下流タスクにわたる大規模なマルチモーダル … 続きを読む

カテゴリー: cs.AI, cs.CV | Scaling-up Perceptual Video Quality Assessment はコメントを受け付けていません

Deep Learning-Based BMD Estimation from Radiographs with Conformal Uncertainty Quantification

要約 限られたDXAアクセスは、骨粗鬆症のスクリーニングを妨げます。 この概念実 … 続きを読む

カテゴリー: cs.CV, stat.AP | Deep Learning-Based BMD Estimation from Radiographs with Conformal Uncertainty Quantification はコメントを受け付けていません

Preference Adaptive and Sequential Text-to-Image Generation

要約 インタラクティブなテキストからイメージ(T2I)生成の問題に対処し、一連の … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.SY, eess.SY | Preference Adaptive and Sequential Text-to-Image Generation はコメントを受け付けていません