「cs.MM」カテゴリーアーカイブ

SLIC: Large Receptive Field Learning with Self-Conditioned Adaptability for Learned Image Compression

投稿日: 2023年8月15日作成者: jarxiv

要約最近、トランスフォーマーは、圧縮などのビジョンタスクにおいて CNN の代 … 続きを読む →

カテゴリー: cs.CV, cs.MM, eess.IV | コメントを受け付けていません

Jurassic World Remake: Bringing Ancient Fossils Back to Life via Zero-Shot Long Image-to-Image Translation

投稿日: 2023年8月15日作成者: jarxiv

要約自然言語からターゲットドメインを深く理解することで、私たちは大きなドメイン … 続きを読む →

カテゴリー: cs.CV, cs.MM, I.4 | コメントを受け付けていません

Towards Unified Text-based Person Retrieval: A Large-scale Multi-Attribute and Language Search Benchmark

投稿日: 2023年8月15日作成者: jarxiv

要約この論文では、MALS と呼ばれる、テキストベースの人物検索のための大規模 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Deep Learning for Diverse Data Types Steganalysis: A Review

投稿日: 2023年8月14日作成者: jarxiv

要約ステガノグラフィーとステガナリシスは、情報セキュリティ分野の 2 つの相互 … 続きを読む →

カテゴリー: cs.AI, cs.CR, cs.LG, cs.MM, cs.SD, eess.AS, eess.IV | コメントを受け付けていません

Towards Unified Text-based Person Retrieval: A Large-scale Multi-Attribute and Language Search Benchmark

投稿日: 2023年8月14日作成者: jarxiv

要約この論文では、MALS と呼ばれる、テキストベースの人物検索のための大規模 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

Versatile Face Animator: Driving Arbitrary 3D Facial Avatar in RGBD Space

投稿日: 2023年8月14日作成者: jarxiv

要約リアルな 3D フェイシャルアニメーションの作成は、映画制作やゲーム業界 … 続きを読む →

カテゴリー: cs.CV, cs.MM, I.3.7 | コメントを受け付けていません

AudioLDM 2: Learning Holistic Audio Generation with Self-supervised Pretraining

投稿日: 2023年8月11日作成者: jarxiv

要約オーディオ生成には、音声、音楽、効果音など、さまざまなタイプのオーディオに … 続きを読む →

カテゴリー: cs.AI, cs.MM, cs.SD, eess.AS, eess.SP | コメントを受け付けていません

Induction Network: Audio-Visual Modality Gap-Bridging for Self-Supervised Sound Source Localization

投稿日: 2023年8月10日作成者: jarxiv

要約自己教師による音源定位は、通常、モダリティの不一致によって困難になります。 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Separate Anything You Describe

投稿日: 2023年8月10日作成者: jarxiv

要約 Language-Queryed Audio Source Separat … 続きを読む →

カテゴリー: cs.AI, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

GEmo-CLAP: Gender-Attribute-Enhanced Contrastive Language-Audio Pretraining for Speech Emotion Recognition

投稿日: 2023年8月9日作成者: jarxiv

要約対照学習ベースのクロスモダリティ事前トレーニングアプローチは、最近、さま … 続きを読む →

カテゴリー: cs.CL, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

「cs.MM」カテゴリーアーカイブ

SLIC: Large Receptive Field Learning with Self-Conditioned Adaptability for Learned Image Compression

Jurassic World Remake: Bringing Ancient Fossils Back to Life via Zero-Shot Long Image-to-Image Translation

Towards Unified Text-based Person Retrieval: A Large-scale Multi-Attribute and Language Search Benchmark

Deep Learning for Diverse Data Types Steganalysis: A Review

Towards Unified Text-based Person Retrieval: A Large-scale Multi-Attribute and Language Search Benchmark

Versatile Face Animator: Driving Arbitrary 3D Facial Avatar in RGBD Space

AudioLDM 2: Learning Holistic Audio Generation with Self-supervised Pretraining

Induction Network: Audio-Visual Modality Gap-Bridging for Self-Supervised Sound Source Localization

Separate Anything You Describe

GEmo-CLAP: Gender-Attribute-Enhanced Contrastive Language-Audio Pretraining for Speech Emotion Recognition

最近の投稿

最近のコメント

アーカイブ

カテゴリー