cs.CV」カテゴリーアーカイブ

BiVLC: Extending Vision-Language Compositionality Evaluation with Text-to-Image Retrieval

要約 SugarCrepe のような既存の視覚言語構成性 (VLC) ベンチマー … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG | BiVLC: Extending Vision-Language Compositionality Evaluation with Text-to-Image Retrieval はコメントを受け付けていません

CMMMU: A Chinese Massive Multi-discipline Multimodal Understanding Benchmark

要約 大規模マルチモーダル モデル (LMM) の機能が進化し続けるにつれて、L … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV | CMMMU: A Chinese Massive Multi-discipline Multimodal Understanding Benchmark はコメントを受け付けていません

SegEarth-OV: Towards Training-Free Open-Vocabulary Segmentation for Remote Sensing Images

要約 リモートセンシング画像は、農業、水資源、軍事、災害救援などの分野で、かけが … 続きを読む

カテゴリー: cs.CV | SegEarth-OV: Towards Training-Free Open-Vocabulary Segmentation for Remote Sensing Images はコメントを受け付けていません

Framer: Interactive Frame Interpolation

要約 私たちはインタラクティブなフレーム補間のための Framer を提案します … 続きを読む

カテゴリー: cs.CV | Framer: Interactive Frame Interpolation はコメントを受け付けていません

Model Pairing Using Embedding Translation for Backdoor Attack Detection on Open-Set Classification Tasks

要約 バックドア攻撃により、攻撃者は機械学習アルゴリズムに特定の脆弱性を埋め込む … 続きを読む

カテゴリー: cs.CR, cs.CV | Model Pairing Using Embedding Translation for Backdoor Attack Detection on Open-Set Classification Tasks はコメントを受け付けていません

Advanced Vision Transformers and Open-Set Learning for Robust Mosquito Classification: A Novel Approach to Entomological Studies

要約 蚊関連疾患は世界の公衆衛生に重大な脅威をもたらしており、効果的な監視と制御 … 続きを読む

カテゴリー: cs.CV | Advanced Vision Transformers and Open-Set Learning for Robust Mosquito Classification: A Novel Approach to Entomological Studies はコメントを受け付けていません

The evolution of volumetric video: A survey of smart transcoding and compression approaches

要約 3 次元 (3D) 画像のキャプチャと表示であるボリュメトリック ビデオは … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.HC | The evolution of volumetric video: A survey of smart transcoding and compression approaches はコメントを受け付けていません

FilterViT and DropoutViT: Lightweight Vision Transformer Models for Efficient Attention Mechanisms

要約 この研究では、MobileViT の拡張バージョンである FilterVi … 続きを読む

カテゴリー: cs.CV | FilterViT and DropoutViT: Lightweight Vision Transformer Models for Efficient Attention Mechanisms はコメントを受け付けていません

Differentially Private Integrated Decision Gradients (IDG-DP) for Radar-based Human Activity Recognition

要約 人間の動作分析は、医療モニタリングと病気の早期発見に大きな可能性をもたらし … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.CV, cs.LG | Differentially Private Integrated Decision Gradients (IDG-DP) for Radar-based Human Activity Recognition はコメントを受け付けていません

Deep Learning on 3D Semantic Segmentation: A Detailed Review

要約 この論文では、3D セマンティック セグメンテーション (3DSS) にお … 続きを読む

カテゴリー: cs.CV | Deep Learning on 3D Semantic Segmentation: A Detailed Review はコメントを受け付けていません