投稿者「jarxiv」のアーカイブ

Towards a General-Purpose Zero-Shot Synthetic Low-Light Image and Video Pipeline

要約 低光の条件は、人間と機械の両方の注釈に大きな課題をもたらします。 これによ … 続きを読む

カテゴリー: cs.CV, eess.IV | Towards a General-Purpose Zero-Shot Synthetic Low-Light Image and Video Pipeline はコメントを受け付けていません

InfoNCE: Identifying the Gap Between Theory and Practice

要約 Infonceの損失を介した対照学習に関する以前の理論は、特定の仮定の下で … 続きを読む

カテゴリー: cs.CV, cs.LG, stat.ML | InfoNCE: Identifying the Gap Between Theory and Practice はコメントを受け付けていません

SpiritSight Agent: Advanced GUI Agent with One Look

要約 グラフィカルユーザーインターフェイス(GUI)エージェントは、ヒューマンコ … 続きを読む

カテゴリー: cs.CV, cs.HC, cs.RO | SpiritSight Agent: Advanced GUI Agent with One Look はコメントを受け付けていません

A Semi-Self-Supervised Approach for Dense-Pattern Video Object Segmentation

要約 ビデオオブジェクトセグメンテーション(VOS) – ビデオの各 … 続きを読む

カテゴリー: cs.CV, eess.IV | A Semi-Self-Supervised Approach for Dense-Pattern Video Object Segmentation はコメントを受け付けていません

CoMotion: Concurrent Multi-person 3D Motion

要約 単一の単眼カメラストリームから複数の人々の詳細な3Dポーズを検出および追跡 … 続きを読む

カテゴリー: cs.CV, cs.LG | CoMotion: Concurrent Multi-person 3D Motion はコメントを受け付けていません

Beyond Patches: Mining Interpretable Part-Prototypes for Explainable AI

要約 ディープラーニングは、マルチメディアシステムにかなりの進歩をもたらしました … 続きを読む

カテゴリー: cs.CV | Beyond Patches: Mining Interpretable Part-Prototypes for Explainable AI はコメントを受け付けていません

Modality-Independent Explainable Detection of Inaccurate Organ Segmentations Using Denoising Autoencoders

要約 放射線療法の計画では、臨床医によって検出されない場合、危険にさらされている … 続きを読む

カテゴリー: cs.CV, eess.IV | Modality-Independent Explainable Detection of Inaccurate Organ Segmentations Using Denoising Autoencoders はコメントを受け付けていません

Towards Realistic Low-Light Image Enhancement via ISP Driven Data Modeling

要約 ディープニューラルネットワーク(DNNS)は、最近、低照度画像強化(LLI … 続きを読む

カテゴリー: cs.CV, cs.MM | Towards Realistic Low-Light Image Enhancement via ISP Driven Data Modeling はコメントを受け付けていません

Self-Supervised Enhancement of Forward-Looking Sonar Images: Bridging Cross-Modal Degradation Gaps through Feature Space Transformation and Multi-Frame Fusion

要約 正確な水中ターゲット検出には、前向きに見えるソナー画像を強化することが重要 … 続きを読む

カテゴリー: cs.CV, eess.IV | Self-Supervised Enhancement of Forward-Looking Sonar Images: Bridging Cross-Modal Degradation Gaps through Feature Space Transformation and Multi-Frame Fusion はコメントを受け付けていません

MMCLIP: Cross-modal Attention Masked Modelling for Medical Language-Image Pre-Training

要約 医療分野のビジョンと言語の事前トレーニング(VLP)は、画像テキストペアで … 続きを読む

カテゴリー: cs.CV | MMCLIP: Cross-modal Attention Masked Modelling for Medical Language-Image Pre-Training はコメントを受け付けていません