月別アーカイブ: 2025年3月

Matrix3D: Large Photogrammetry Model All-in-One

要約 同じモデルを使用して、ポーズ推定、深度予測、新しいビュー合成を含むいくつか … 続きを読む

カテゴリー: cs.CV | Matrix3D: Large Photogrammetry Model All-in-One はコメントを受け付けていません

A Language Anchor-Guided Method for Robust Noisy Domain Generalization

要約 現実世界の機械学習アプリケーションは、分布シフトとラベルノイズという2つの … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | A Language Anchor-Guided Method for Robust Noisy Domain Generalization はコメントを受け付けていません

A Deep Learning Framework for Visual Attention Prediction and Analysis of News Interfaces

要約 ニュースアウトレットのニュースインターフェイスでの注意の競争により、人口統 … 続きを読む

カテゴリー: cs.CV, cs.HC | A Deep Learning Framework for Visual Attention Prediction and Analysis of News Interfaces はコメントを受け付けていません

PP-DocLayout: A Unified Document Layout Detection Model to Accelerate Large-Scale Data Construction

要約 ドキュメントレイアウト分析は、ドキュメントインテリジェンスの重要な前処理ス … 続きを読む

カテゴリー: cs.AI, cs.CV | PP-DocLayout: A Unified Document Layout Detection Model to Accelerate Large-Scale Data Construction はコメントを受け付けていません

UniCoRN: Latent Diffusion-based Unified Controllable Image Restoration Network across Multiple Degradations

要約 画像の復元は、コンピュータービジョンタスク全体で劣化した画像を強化するため … 続きを読む

カテゴリー: cs.CV | UniCoRN: Latent Diffusion-based Unified Controllable Image Restoration Network across Multiple Degradations はコメントを受け付けていません

UniCon: Unidirectional Information Flow for Effective Control of Large-Scale Diffusion Models

要約 大規模拡散モデルのトレーニングアダプターの制御と効率を高めるために設計され … 続きを読む

カテゴリー: cs.CV | UniCon: Unidirectional Information Flow for Effective Control of Large-Scale Diffusion Models はコメントを受け付けていません

Neuro-Symbolic Scene Graph Conditioning for Synthetic Image Dataset Generation

要約 機械学習モデルがスケールと複雑さを増加させるにつれて、十分なトレーニングデ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Neuro-Symbolic Scene Graph Conditioning for Synthetic Image Dataset Generation はコメントを受け付けていません

Leveraging Text-to-Image Generation for Handling Spurious Correlation

要約 経験的リスク最小化でトレーニングされた深いニューラルネットワーク(ERM) … 続きを読む

カテゴリー: cs.CV | Leveraging Text-to-Image Generation for Handling Spurious Correlation はコメントを受け付けていません

Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID

要約 熱赤外ビデオで複数の無人航空機(UAV)を検出および追跡することは、コント … 続きを読む

カテゴリー: cs.AI, cs.CV | Strong Baseline: Multi-UAV Tracking via YOLOv12 with BoT-SORT-ReID はコメントを受け付けていません

Slide-Level Prompt Learning with Vision Language Models for Few-Shot Multiple Instance Learning in Histopathology

要約 この論文では、基礎ビジョン言語モデル(VLM)とスライドレベルの迅速な学習 … 続きを読む

カテゴリー: cs.CV | Slide-Level Prompt Learning with Vision Language Models for Few-Shot Multiple Instance Learning in Histopathology はコメントを受け付けていません