cs.MM」カテゴリーアーカイブ

Did You Train on My Dataset? Towards Public Dataset Protection with Clean-Label Backdoor Watermarking

要約 タイトル:「Did You Train on My Dataset?Tow … 続きを読む

カテゴリー: cs.AI, cs.CR, cs.LG, cs.MM | Did You Train on My Dataset? Towards Public Dataset Protection with Clean-Label Backdoor Watermarking はコメントを受け付けていません

CAVL: Learning Contrastive and Adaptive Representations of Vision and Language

要約 【タイトル】CAVL: Vision and Languageの対比的かつ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | CAVL: Learning Contrastive and Adaptive Representations of Vision and Language はコメントを受け付けていません

DSVAE: Interpretable Disentangled Representation for Synthetic Speech Detection

要約 タイトル:DSVAE:合成音声検出のための解釈可能な分離表現 要約: &# … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | DSVAE: Interpretable Disentangled Representation for Synthetic Speech Detection はコメントを受け付けていません

Dynamic Multimodal Fusion

要約 タイトル:ダイナミックマルチモーダルフュージョン 要約: – … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Dynamic Multimodal Fusion はコメントを受け付けていません

Temporal Dynamic Synchronous Functional Brain Network for Schizophrenia Diagnosis and Lateralization Analysis

要約 タイトル:統合失調症の診断と側脳化分析のための時間的動的同期的機能的脳ネッ … 続きを読む

カテゴリー: cs.LG, cs.MM, q-bio.NC | Temporal Dynamic Synchronous Functional Brain Network for Schizophrenia Diagnosis and Lateralization Analysis はコメントを受け付けていません

A Closer Look at Audio-Visual Semantic Segmentation

要約 【タイトル】オーディオ・ビジュアルセマンティックセグメンテーションをより詳 … 続きを読む

カテゴリー: cs.CV, cs.MM | A Closer Look at Audio-Visual Semantic Segmentation はコメントを受け付けていません

VLPD: Context-Aware Pedestrian Detection via Vision-Language Semantic Self-Supervision

要約 タイトル:VLPD:Vision-Language Semantic Se … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | VLPD: Context-Aware Pedestrian Detection via Vision-Language Semantic Self-Supervision はコメントを受け付けていません

Enhancing Multimodal Entity and Relation Extraction with Variational Information Bottleneck

要約 タイトル:バリアブルインフォメーションボトルネックでマルチモーダルエンティ … 続きを読む

カテゴリー: cs.CL, cs.MM | Enhancing Multimodal Entity and Relation Extraction with Variational Information Bottleneck はコメントを受け付けていません

Multimodal Garment Designer: Human-Centric Latent Diffusion Models for Fashion Image Editing

要約 タイトル: 人間中心の潜在拡散モデルによるファッション画像編集のためのマル … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Multimodal Garment Designer: Human-Centric Latent Diffusion Models for Fashion Image Editing はコメントを受け付けていません

ChartReader: A Unified Framework for Chart Derendering and Comprehension without Heuristic Rules

要約 タイトル:「heuristicルールを必要としないチャートの解析および理解 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | ChartReader: A Unified Framework for Chart Derendering and Comprehension without Heuristic Rules はコメントを受け付けていません