cs.MM」カテゴリーアーカイブ

Vision, Deduction and Alignment: An Empirical Study on Multi-modal Knowledge Graph Alignment

要約 ナレッジ グラフ (KG) のエンティティ アライメント (EA) は、ナ … 続きを読む

カテゴリー: cs.AI, cs.MM | Vision, Deduction and Alignment: An Empirical Study on Multi-modal Knowledge Graph Alignment はコメントを受け付けていません

Revisiting Pre-training in Audio-Visual Learning

要約 事前トレーニング手法は、さまざまなタスクでモデルのパフォーマンスを向上させ … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | Revisiting Pre-training in Audio-Visual Learning はコメントを受け付けていません

Lip-to-Speech Synthesis in the Wild with Multi-task Learning

要約 最近の研究では、視覚情報のみから音声を再構築することを目的とした口語合成で … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | Lip-to-Speech Synthesis in the Wild with Multi-task Learning はコメントを受け付けていません

Audio-Visual Segmentation

要約 オーディオ ビジュアル セグメンテーション (AVS) と呼ばれる新しい問 … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS, eess.IV | Audio-Visual Segmentation はコメントを受け付けていません

CK-Transformer: Commonsense Knowledge Enhanced Transformers for Referring Expression Comprehension

要約 自然言語表現によって記述された画像領域のローカライズを目的としたマルチモー … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | CK-Transformer: Commonsense Knowledge Enhanced Transformers for Referring Expression Comprehension はコメントを受け付けていません

T2I-Adapter: Learning Adapters to Dig out More Controllable Ability for Text-to-Image Diffusion Models

要約 大規模な text-to-image (T2I) モデルの信じられないほど … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | T2I-Adapter: Learning Adapters to Dig out More Controllable Ability for Text-to-Image Diffusion Models はコメントを受け付けていません

On the Importance of Noise Scheduling for Diffusion Models

要約 拡散生成モデルのノイズを除去するためのノイズスケジューリング戦略の効果を経 … 続きを読む

カテゴリー: cs.CV, cs.GR, cs.LG, cs.MM | On the Importance of Noise Scheduling for Diffusion Models はコメントを受け付けていません

Protein Representation Learning via Knowledge Enhanced Primary Structure Modeling

要約 タンパク質表現学習は、主に言語モデル (LM) の目覚ましい発展の恩恵を受 … 続きを読む

カテゴリー: cs.CL, cs.LG, cs.MM | Protein Representation Learning via Knowledge Enhanced Primary Structure Modeling はコメントを受け付けていません

Deepfake Detection: A Comprehensive Study from the Reliability Perspective

要約 インターネット上で流通しているディープフェイクの合成素材は、政治家、有名人 … 続きを読む

カテゴリー: cs.CV, cs.MM | Deepfake Detection: A Comprehensive Study from the Reliability Perspective はコメントを受け付けていません

3D-VFD: A Victim-free Detector against 3D Adversarial Point Clouds

要約 点群を使用する 3D ディープ モデルは、コンピューター ビジョンで優れた … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV | 3D-VFD: A Victim-free Detector against 3D Adversarial Point Clouds はコメントを受け付けていません