「cs.CV」カテゴリーアーカイブ

PP-DocLayout: A Unified Document Layout Detection Model to Accelerate Large-Scale Data Construction

投稿日: 2025年3月24日作成者: jarxiv

要約ドキュメントレイアウト分析は、ドキュメントインテリジェンスの重要な前処理ス … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

UniCoRN: Latent Diffusion-based Unified Controllable Image Restoration Network across Multiple Degradations

投稿日: 2025年3月24日作成者: jarxiv

要約画像の復元は、コンピュータービジョンタスク全体で劣化した画像を強化するため … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

UniCon: Unidirectional Information Flow for Effective Control of Large-Scale Diffusion Models

投稿日: 2025年3月24日作成者: jarxiv

要約大規模拡散モデルのトレーニングアダプターの制御と効率を高めるために設計され … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Neuro-Symbolic Scene Graph Conditioning for Synthetic Image Dataset Generation

投稿日: 2025年3月24日作成者: jarxiv

要約機械学習モデルがスケールと複雑さを増加させるにつれて、十分なトレーニングデ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Leveraging Text-to-Image Generation for Handling Spurious Correlation

投稿日: 2025年3月24日作成者: jarxiv

要約経験的リスク最小化でトレーニングされた深いニューラルネットワーク（ERM） … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID

投稿日: 2025年3月24日作成者: jarxiv

要約熱赤外ビデオで複数の無人航空機（UAV）を検出および追跡することは、コント … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Slide-Level Prompt Learning with Vision Language Models for Few-Shot Multiple Instance Learning in Histopathology

投稿日: 2025年3月24日作成者: jarxiv

要約この論文では、基礎ビジョン言語モデル（VLM）とスライドレベルの迅速な学習 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

RadioActive: 3D Radiological Interactive Segmentation Benchmark

投稿日: 2025年3月24日作成者: jarxiv

要約臨床医の努力を最小限に抑えた楽で正確なセグメンテーションは、臨床ワークフロ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.HC, cs.LG | コメントを受け付けていません

Deep End-to-End Posterior ENergy (DEEPEN) for image recovery

投稿日: 2025年3月24日作成者: jarxiv

要約現在のエンドツーエンド（E2E）およびプラグアンドプレイ（PNP）画像再構 … 続きを読む →

カテゴリー: cs.CV, cs.LG, eess.IV | コメントを受け付けていません

TruthPrInt: Mitigating LVLM Object Hallucination Via Latent Truthful-Guided Pre-Intervention

投稿日: 2025年3月24日作成者: jarxiv

要約オブジェクト幻覚（OH）は、大規模な視覚言語モデル（LVLMS）における主 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV | コメントを受け付けていません

「cs.CV」カテゴリーアーカイブ

PP-DocLayout: A Unified Document Layout Detection Model to Accelerate Large-Scale Data Construction

UniCoRN: Latent Diffusion-based Unified Controllable Image Restoration Network across Multiple Degradations

UniCon: Unidirectional Information Flow for Effective Control of Large-Scale Diffusion Models

Neuro-Symbolic Scene Graph Conditioning for Synthetic Image Dataset Generation

Leveraging Text-to-Image Generation for Handling Spurious Correlation

Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID

Slide-Level Prompt Learning with Vision Language Models for Few-Shot Multiple Instance Learning in Histopathology

RadioActive: 3D Radiological Interactive Segmentation Benchmark

Deep End-to-End Posterior ENergy (DEEPEN) for image recovery

TruthPrInt: Mitigating LVLM Object Hallucination Via Latent Truthful-Guided Pre-Intervention

最近の投稿

最近のコメント

アーカイブ

カテゴリー