「cs.MM」カテゴリーアーカイブ

Did You Train on My Dataset? Towards Public Dataset Protection with Clean-Label Backdoor Watermarking

投稿日: 2023年4月11日作成者: jarxiv

要約タイトル：「Did You Train on My Dataset？Tow … 続きを読む →

カテゴリー: cs.AI, cs.CR, cs.LG, cs.MM | コメントを受け付けていません

CAVL: Learning Contrastive and Adaptive Representations of Vision and Language

投稿日: 2023年4月11日作成者: jarxiv

要約【タイトル】CAVL: Vision and Languageの対比的かつ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

DSVAE: Interpretable Disentangled Representation for Synthetic Speech Detection

投稿日: 2023年4月10日作成者: jarxiv

要約タイトル：DSVAE：合成音声検出のための解釈可能な分離表現要約： &# … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Dynamic Multimodal Fusion

投稿日: 2023年4月10日作成者: jarxiv

要約タイトル：ダイナミックマルチモーダルフュージョン要約： – … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

Temporal Dynamic Synchronous Functional Brain Network for Schizophrenia Diagnosis and Lateralization Analysis

投稿日: 2023年4月7日作成者: jarxiv

要約タイトル：統合失調症の診断と側脳化分析のための時間的動的同期的機能的脳ネッ … 続きを読む →

カテゴリー: cs.LG, cs.MM, q-bio.NC | コメントを受け付けていません

A Closer Look at Audio-Visual Semantic Segmentation

投稿日: 2023年4月7日作成者: jarxiv

要約【タイトル】オーディオ・ビジュアルセマンティックセグメンテーションをより詳 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

VLPD: Context-Aware Pedestrian Detection via Vision-Language Semantic Self-Supervision

投稿日: 2023年4月7日作成者: jarxiv

要約タイトル：VLPD：Vision-Language Semantic Se … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

Enhancing Multimodal Entity and Relation Extraction with Variational Information Bottleneck

投稿日: 2023年4月6日作成者: jarxiv

要約タイトル：バリアブルインフォメーションボトルネックでマルチモーダルエンティ … 続きを読む →

カテゴリー: cs.CL, cs.MM | コメントを受け付けていません

Multimodal Garment Designer: Human-Centric Latent Diffusion Models for Fashion Image Editing

投稿日: 2023年4月6日作成者: jarxiv

要約タイトル：人間中心の潜在拡散モデルによるファッション画像編集のためのマル … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

ChartReader: A Unified Framework for Chart Derendering and Comprehension without Heuristic Rules

投稿日: 2023年4月6日作成者: jarxiv

要約タイトル：「heuristicルールを必要としないチャートの解析および理解 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM | コメントを受け付けていません

「cs.MM」カテゴリーアーカイブ

Did You Train on My Dataset? Towards Public Dataset Protection with Clean-Label Backdoor Watermarking

CAVL: Learning Contrastive and Adaptive Representations of Vision and Language

DSVAE: Interpretable Disentangled Representation for Synthetic Speech Detection

Dynamic Multimodal Fusion

Temporal Dynamic Synchronous Functional Brain Network for Schizophrenia Diagnosis and Lateralization Analysis

A Closer Look at Audio-Visual Semantic Segmentation

VLPD: Context-Aware Pedestrian Detection via Vision-Language Semantic Self-Supervision

Enhancing Multimodal Entity and Relation Extraction with Variational Information Bottleneck

Multimodal Garment Designer: Human-Centric Latent Diffusion Models for Fashion Image Editing

ChartReader: A Unified Framework for Chart Derendering and Comprehension without Heuristic Rules

最近の投稿

最近のコメント

アーカイブ

カテゴリー