月別アーカイブ: 2024年9月

The Impact of Print-Scanning in Heterogeneous Morph Evaluation Scenarios

要約 フェイスモーフィング攻撃は、顔認識(FR)システムにとってますます脅威とな … 続きを読む

カテゴリー: cs.CV | The Impact of Print-Scanning in Heterogeneous Morph Evaluation Scenarios はコメントを受け付けていません

Cross-Platform Video Person ReID: A New Benchmark Dataset and Adaptation Approach

要約 G2A-VReIDは、185,907の画像と5,576のトラックレットから … 続きを読む

カテゴリー: cs.CV | Cross-Platform Video Person ReID: A New Benchmark Dataset and Adaptation Approach はコメントを受け付けていません

TagCLIP: Improving Discrimination Ability of Open-Vocabulary Semantic Segmentation

要約 コントラスト言語画像事前学習(CLIP)は、最近ピクセルレベルのゼロショッ … 続きを読む

カテゴリー: cs.CV | TagCLIP: Improving Discrimination Ability of Open-Vocabulary Semantic Segmentation はコメントを受け付けていません

Learn Suspected Anomalies from Event Prompts for Video Anomaly Detection

要約 弱教師付きビデオ異常検出(WS-VAD)のほとんどのモデルは、異常のタイプ … 続きを読む

カテゴリー: cs.CV | Learn Suspected Anomalies from Event Prompts for Video Anomaly Detection はコメントを受け付けていません

Towards reliable respiratory disease diagnosis based on cough sounds and vision transformers

要約 近年のディープラーニング技術の進歩により、マルチモーダルな医療データに基づ … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | Towards reliable respiratory disease diagnosis based on cough sounds and vision transformers はコメントを受け付けていません

DocKylin: A Large Multimodal Model for Visual Document Understanding with Efficient Visual Slimming

要約 現在のマルチモーダル大規模言語モデル(MLLM)は、文書画像に典型的な高解 … 続きを読む

カテゴリー: cs.CV | DocKylin: A Large Multimodal Model for Visual Document Understanding with Efficient Visual Slimming はコメントを受け付けていません

Image-Based Virtual Try-On: A Survey

要約 画像ベースのバーチャル試着は、自然な服装をした人物の画像と衣服の画像を合成 … 続きを読む

カテゴリー: cs.CV | Image-Based Virtual Try-On: A Survey はコメントを受け付けていません

Learning from the Web: Language Drives Weakly-Supervised Incremental Learning for Semantic Segmentation

要約 現在の弱教師付き逐次学習によるセマンティックセグメンテーション(WILSS … 続きを読む

カテゴリー: cs.CV | Learning from the Web: Language Drives Weakly-Supervised Incremental Learning for Semantic Segmentation はコメントを受け付けていません

Correlation-Embedded Transformer Tracking: A Single-Branch Framework

要約 ロバストで識別可能な外観モデルの開発は、視覚物体追跡における長年の研究課題 … 続きを読む

カテゴリー: cs.CV | Correlation-Embedded Transformer Tracking: A Single-Branch Framework はコメントを受け付けていません

White-Box Transformers via Sparse Rate Reduction: Compression Is All There Is?

要約 本論文では、表現学習の自然な目的は、データの分布、例えばトークンの集合を、 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | White-Box Transformers via Sparse Rate Reduction: Compression Is All There Is? はコメントを受け付けていません