「cs.MM」カテゴリーアーカイブ

SepMark: Deep Separable Watermarking for Unified Source Tracing and Deepfake Detection

投稿日: 2023年8月2日作成者: jarxiv

要約悪意のあるディープフェイクは、本物の顔と偽造された顔を区別することをめぐっ … 続きを読む →

カテゴリー: cs.CV, cs.MM, eess.IV | コメントを受け付けていません

Relation-Aware Distribution Representation Network for Person Clustering with Multiple Modalities

投稿日: 2023年8月2日作成者: jarxiv

要約顔、体、声などのマルチモーダルな手がかりを使った人物のクラスタリングは、映 … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

SAS Video-QA: Self-Adaptive Sampling for Efficient Video Question-Answering

投稿日: 2023年8月2日作成者: jarxiv

要約ビデオの質問と回答は、ビデオ理解の分野における基本的なタスクです。 Vid … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | コメントを受け付けていません

Contrastive Conditional Latent Diffusion for Audio-visual Segmentation

投稿日: 2023年8月1日作成者: jarxiv

要約我々は、オーディオの寄与を広範囲に調査するために、オーディオビジュアルセグ … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Advancing Smart Malnutrition Monitoring: A Multi-Modal Learning Approach for Vital Health Parameter Estimation

投稿日: 2023年8月1日作成者: jarxiv

要約栄養失調は、必須栄養素の不十分な摂取に起因し、重要な器官や身体機能全体に悪 … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.CY, cs.MM | コメントを受け付けていません

DiffKendall: A Novel Approach for Few-Shot Learning with Differentiable Kendall’s Rank Correlation

投稿日: 2023年7月31日作成者: jarxiv

要約フューショット学習は、ベースデータセットでトレーニングされたモデルを、モ … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | コメントを受け付けていません

Improving Social Media Popularity Prediction with Multiple Post Dependencies

投稿日: 2023年7月31日作成者: jarxiv

要約ソーシャルメディア人気予測は、レコメンデーションシステムやマルチメディ … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.MM | コメントを受け付けていません

Towards Multimodal Prediction of Spontaneous Humour: A Novel Dataset and First Results

投稿日: 2023年7月31日作成者: jarxiv

要約ユーモアは人間の感情と認知の重要な要素です。その自動理解により、より自然 … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

CN-Celeb-AV: A Multi-Genre Audio-Visual Dataset for Person Recognition

投稿日: 2023年7月31日作成者: jarxiv

要約オーディオビジュアル人物認識 (AVPR) は大きな注目を集めています。 … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

CLIP Brings Better Features to Visual Aesthetics Learners

投稿日: 2023年7月31日作成者: jarxiv

要約さまざまな下流タスクに対する事前トレーニングアプローチの成功により、コン … 続きを読む →

カテゴリー: cs.CV, cs.MM | コメントを受け付けていません

「cs.MM」カテゴリーアーカイブ

SepMark: Deep Separable Watermarking for Unified Source Tracing and Deepfake Detection

Relation-Aware Distribution Representation Network for Person Clustering with Multiple Modalities

SAS Video-QA: Self-Adaptive Sampling for Efficient Video Question-Answering

Contrastive Conditional Latent Diffusion for Audio-visual Segmentation

Advancing Smart Malnutrition Monitoring: A Multi-Modal Learning Approach for Vital Health Parameter Estimation

DiffKendall: A Novel Approach for Few-Shot Learning with Differentiable Kendall’s Rank Correlation

Improving Social Media Popularity Prediction with Multiple Post Dependencies

Towards Multimodal Prediction of Spontaneous Humour: A Novel Dataset and First Results

CN-Celeb-AV: A Multi-Genre Audio-Visual Dataset for Person Recognition

CLIP Brings Better Features to Visual Aesthetics Learners

最近の投稿

最近のコメント

アーカイブ

カテゴリー