投稿者「jarxiv」のアーカイブ

MECD+: Unlocking Event-Level Causal Graph Discovery for Video Reasoning

投稿日: 2025年1月17日作成者: jarxiv

要約ビデオ因果推論は、因果関係の観点からビデオを高度に理解することを目的として … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Metric Learning with Progressive Self-Distillation for Audio-Visual Embedding Learning

投稿日: 2025年1月17日作成者: jarxiv

要約メトリクス学習はサンプルを埋め込み空間に投影し、そこで学習された表現に基づ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.IR, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

WMamba: Wavelet-based Mamba for Face Forgery Detection

投稿日: 2025年1月17日作成者: jarxiv

要約ディープフェイク生成技術の急速な進歩に伴い、堅牢かつ正確な顔偽造検出アルゴ … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

Improving Zero-Shot Object-Level Change Detection by Incorporating Visual Correspondence

投稿日: 2025年1月17日作成者: jarxiv

要約異なるビューにわたる 2 つの画像間のオブジェクトレベルの変化を検出するこ … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

A Comprehensive Survey of Foundation Models in Medicine

投稿日: 2025年1月17日作成者: jarxiv

要約基礎モデル (FM) は、多くの場合、自己教師あり学習手法を使用して、大規 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

Unified Face Matching and Physical-Digital Spoofing Attack Detection

投稿日: 2025年1月17日作成者: jarxiv

要約顔認識テクノロジーは、セキュリティ、監視、認証システムの状況を劇的に変革し … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

A Comparative Study on Multi-task Uncertainty Quantification in Semantic Segmentation and Monocular Depth Estimation

投稿日: 2025年1月17日作成者: jarxiv

要約ディープニューラルネットワークは、セマンティックセグメンテーションや … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG | コメントを受け付けていません

VIS-MAE: An Efficient Self-supervised Learning Approach on Medical Image Segmentation and Classification

投稿日: 2025年1月17日作成者: jarxiv

要約人工知能 (AI) は、医療画像における診断とセグメンテーションに革命をも … 続きを読む →

カテゴリー: cs.CV, eess.IV | コメントを受け付けていません

Robin: a Suite of Multi-Scale Vision-Language Models and the CHIRP Evaluation Benchmark

投稿日: 2025年1月17日作成者: jarxiv

要約過去数年間における視覚言語モデル (VLM) の急増により、厳密かつ包括的 … 続きを読む →

カテゴリー: cs.AI, cs.CV | コメントを受け付けていません

Super-class guided Transformer for Zero-Shot Attribute Classification

投稿日: 2025年1月17日作成者: jarxiv

要約属性分類は、画像領域内の特定の特徴を識別するために重要です。ビジョン言語 … 続きを読む →

カテゴリー: cs.CV | コメントを受け付けていません

投稿者「jarxiv」のアーカイブ

MECD+: Unlocking Event-Level Causal Graph Discovery for Video Reasoning

Metric Learning with Progressive Self-Distillation for Audio-Visual Embedding Learning

WMamba: Wavelet-based Mamba for Face Forgery Detection

Improving Zero-Shot Object-Level Change Detection by Incorporating Visual Correspondence

A Comprehensive Survey of Foundation Models in Medicine

Unified Face Matching and Physical-Digital Spoofing Attack Detection

A Comparative Study on Multi-task Uncertainty Quantification in Semantic Segmentation and Monocular Depth Estimation

VIS-MAE: An Efficient Self-supervised Learning Approach on Medical Image Segmentation and Classification

Robin: a Suite of Multi-Scale Vision-Language Models and the CHIRP Evaluation Benchmark

Super-class guided Transformer for Zero-Shot Attribute Classification

最近の投稿

最近のコメント

アーカイブ

カテゴリー