月別アーカイブ: 2024年3月

MeaCap: Memory-Augmented Zero-shot Image Captioning

要約 適切にペアリングされた画像テキスト データを使用しないゼロショット画像キャ … 続きを読む

カテゴリー: cs.CV | MeaCap: Memory-Augmented Zero-shot Image Captioning はコメントを受け付けていません

Transformer-based nowcasting of radar composites from satellite images for severe weather

要約 気象レーダー データはナウキャスティングにとって重要であり、数値気象予測モ … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV, physics.ao-ph | Transformer-based nowcasting of radar composites from satellite images for severe weather はコメントを受け付けていません

Robust Quantification of Percent Emphysema on CT via Domain Attention: the Multi-Ethnic Study of Atherosclerosis (MESA) Lung Study

要約 コンピューター断層撮影 (CT) による肺気腫の確実な定量化は、さまざまな … 続きを読む

カテゴリー: cs.CV | Robust Quantification of Percent Emphysema on CT via Domain Attention: the Multi-Ethnic Study of Atherosclerosis (MESA) Lung Study はコメントを受け付けていません

Multimodal Transformer for Comics Text-Cloze

要約 この作品は、視覚的要素とテキスト要素が複雑に絡み合っている媒体であるコミッ … 続きを読む

カテゴリー: cs.CV | Multimodal Transformer for Comics Text-Cloze はコメントを受け付けていません

CMDA: Cross-Modal and Domain Adversarial Adaptation for LiDAR-Based 3D Object Detection

要約 最近の LiDAR ベースの 3D 物体検出 (3DOD) 手法は有望な結 … 続きを読む

カテゴリー: cs.CV, I.2.10 | CMDA: Cross-Modal and Domain Adversarial Adaptation for LiDAR-Based 3D Object Detection はコメントを受け付けていません

Bridging Diversity and Uncertainty in Active learning with Self-Supervised Pre-Training

要約 この研究は、特に自己教師付き事前トレーニング済みモデルのコンテキスト内での … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG | Bridging Diversity and Uncertainty in Active learning with Self-Supervised Pre-Training はコメントを受け付けていません

Learning 3D object-centric representation through prediction

要約 人間の核となる知識の一部として、オブジェクトの表現は、高レベルの概念と象徴 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, I.2.10 | Learning 3D object-centric representation through prediction はコメントを受け付けていません

Towards Concept-based Interpretability of Skin Lesion Diagnosis using Vision-Language Models

要約 医療専門家が病変の一連の視覚パターンに基づいて決定を下すため、コンセプトベ … 続きを読む

カテゴリー: cs.CV | Towards Concept-based Interpretability of Skin Lesion Diagnosis using Vision-Language Models はコメントを受け付けていません

Unifying Generation and Compression: Ultra-low bitrate Image Coding Via Multi-stage Transformer

要約 生成圧縮技術の最近の進歩により、圧縮データの知覚品質が大幅に向上しました。 … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.IV | Unifying Generation and Compression: Ultra-low bitrate Image Coding Via Multi-stage Transformer はコメントを受け付けていません

Self-supervised Photographic Image Layout Representation Learning

要約 画像レイアウト表現学習の領域では、画像レイアウトを簡潔なベクトル形式に変換 … 続きを読む

カテゴリー: cs.CV, cs.MM | Self-supervised Photographic Image Layout Representation Learning はコメントを受け付けていません