投稿者「jarxiv」のアーカイブ

VLM Can Be a Good Assistant: Enhancing Embodied Visual Tracking with Self-Improving Vision-Language Models

投稿日: 2025年5月29日作成者: jarxiv

要約環境視覚モデル（VLM）を使用して具体化された視覚追跡（EVT）を強化する … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Structurally Different Neural Network Blocks for the Segmentation of Atrial and Aortic Perivascular Adipose Tissue in Multi-centre CT Angiography Scans

投稿日: 2025年5月29日作成者: jarxiv

要約畳み込みニューラルネットワーク（CNNS）の出現以来、視覚変圧器（VITS … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Surf2CT: Cascaded 3D Flow Matching Models for Torso 3D CT Synthesis from Skin Surface

投稿日: 2025年5月29日作成者: jarxiv

要約外部表面スキャンと単純な人口統計データ（年齢、性別、身長、体重）からのヒト … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

PathFL: Multi-Alignment Federated Learning for Pathology Image Segmentation

投稿日: 2025年5月29日作成者: jarxiv

要約複数のセンター全体での病理学の画像セグメンテーションは、イメージングモダリ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

PrismLayers: Open Data for High-Quality Multi-Layer Transparent Image Generative Models

投稿日: 2025年5月29日作成者: jarxiv

要約テキストプロンプトから高品質の多層透明な画像を生成すると、新しいレベルのク … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Thinking with Generated Images

投稿日: 2025年5月29日作成者: jarxiv

要約生成された画像で思考を提示します。これは、中間視覚的思考ステップの自発的な … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

RiverMamba: A State Space Model for Global River Discharge and Flood Forecasting

投稿日: 2025年5月29日作成者: jarxiv

要約河川排出予測の最近の深い学習アプローチにより、洪水予測の精度と効率が向上し … 続きを読む →

カテゴリー: cs.CV, cs.LG | コメントを受け付けていません

Scaling-up Perceptual Video Quality Assessment

投稿日: 2025年5月29日作成者: jarxiv

要約データスケーリング法は、さまざまな下流タスクにわたる大規模なマルチモーダル … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Deep Learning-Based BMD Estimation from Radiographs with Conformal Uncertainty Quantification

投稿日: 2025年5月29日作成者: jarxiv

要約限られたDXAアクセスは、骨粗鬆症のスクリーニングを妨げます。この概念実 … 続きを読む →

カテゴリー: cs.CV, stat.AP | コメントを受け付けていません

Preference Adaptive and Sequential Text-to-Image Generation

投稿日: 2025年5月29日作成者: jarxiv

要約インタラクティブなテキストからイメージ（T2I）生成の問題に対処し、一連の … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.LG, cs.SY, eess.SY | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

VLM Can Be a Good Assistant: Enhancing Embodied Visual Tracking with Self-Improving Vision-Language Models

Structurally Different Neural Network Blocks for the Segmentation of Atrial and Aortic Perivascular Adipose Tissue in Multi-centre CT Angiography Scans

Surf2CT: Cascaded 3D Flow Matching Models for Torso 3D CT Synthesis from Skin Surface

PathFL: Multi-Alignment Federated Learning for Pathology Image Segmentation

PrismLayers: Open Data for High-Quality Multi-Layer Transparent Image Generative Models

Thinking with Generated Images

RiverMamba: A State Space Model for Global River Discharge and Flood Forecasting

Scaling-up Perceptual Video Quality Assessment

Deep Learning-Based BMD Estimation from Radiographs with Conformal Uncertainty Quantification

Preference Adaptive and Sequential Text-to-Image Generation

最近の投稿

最近のコメント

アーカイブ

カテゴリー