cs.MM」カテゴリーアーカイブ

SepMark: Deep Separable Watermarking for Unified Source Tracing and Deepfake Detection

要約 悪意のあるディープフェイクは、本物の顔と偽造された顔を区別することをめぐっ … 続きを読む

カテゴリー: cs.CV, cs.MM, eess.IV | SepMark: Deep Separable Watermarking for Unified Source Tracing and Deepfake Detection はコメントを受け付けていません

Relation-Aware Distribution Representation Network for Person Clustering with Multiple Modalities

要約 顔、体、声などのマルチモーダルな手がかりを使った人物のクラスタリングは、映 … 続きを読む

カテゴリー: cs.CV, cs.MM | Relation-Aware Distribution Representation Network for Person Clustering with Multiple Modalities はコメントを受け付けていません

SAS Video-QA: Self-Adaptive Sampling for Efficient Video Question-Answering

要約 ビデオの質問と回答は、ビデオ理解の分野における基本的なタスクです。 Vid … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | SAS Video-QA: Self-Adaptive Sampling for Efficient Video Question-Answering はコメントを受け付けていません

Contrastive Conditional Latent Diffusion for Audio-visual Segmentation

要約 我々は、オーディオの寄与を広範囲に調査するために、オーディオビジュアルセグ … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | Contrastive Conditional Latent Diffusion for Audio-visual Segmentation はコメントを受け付けていません

Advancing Smart Malnutrition Monitoring: A Multi-Modal Learning Approach for Vital Health Parameter Estimation

要約 栄養失調は、必須栄養素の不十分な摂取に起因し、重要な器官や身体機能全体に悪 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.CY, cs.MM | Advancing Smart Malnutrition Monitoring: A Multi-Modal Learning Approach for Vital Health Parameter Estimation はコメントを受け付けていません

DiffKendall: A Novel Approach for Few-Shot Learning with Differentiable Kendall’s Rank Correlation

要約 フューショット学習は、ベース データセットでトレーニングされたモデルを、モ … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM | DiffKendall: A Novel Approach for Few-Shot Learning with Differentiable Kendall’s Rank Correlation はコメントを受け付けていません

Improving Social Media Popularity Prediction with Multiple Post Dependencies

要約 ソーシャル メディア人気予測は、レコメンデーション システムやマルチメディ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.MM | Improving Social Media Popularity Prediction with Multiple Post Dependencies はコメントを受け付けていません

Towards Multimodal Prediction of Spontaneous Humour: A Novel Dataset and First Results

要約 ユーモアは人間の感情と認知の重要な要素です。 その自動理解により、より自然 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | Towards Multimodal Prediction of Spontaneous Humour: A Novel Dataset and First Results はコメントを受け付けていません

CN-Celeb-AV: A Multi-Genre Audio-Visual Dataset for Person Recognition

要約 オーディオビジュアル人物認識 (AVPR) は大きな注目を集めています。 … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | CN-Celeb-AV: A Multi-Genre Audio-Visual Dataset for Person Recognition はコメントを受け付けていません

CLIP Brings Better Features to Visual Aesthetics Learners

要約 さまざまな下流タスクに対する事前トレーニング アプローチの成功により、コン … 続きを読む

カテゴリー: cs.CV, cs.MM | CLIP Brings Better Features to Visual Aesthetics Learners はコメントを受け付けていません