cs.MM」カテゴリーアーカイブ

Towards Multimodal Prediction of Spontaneous Humour: A Novel Dataset and First Results

要約 ユーモアは人間の感情と認知の重要な要素です。 その自動理解により、より自然 … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | Towards Multimodal Prediction of Spontaneous Humour: A Novel Dataset and First Results はコメントを受け付けていません

CN-Celeb-AV: A Multi-Genre Audio-Visual Dataset for Person Recognition

要約 オーディオビジュアル人物認識 (AVPR) は大きな注目を集めています。 … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | CN-Celeb-AV: A Multi-Genre Audio-Visual Dataset for Person Recognition はコメントを受け付けていません

CLIP Brings Better Features to Visual Aesthetics Learners

要約 さまざまな下流タスクに対する事前トレーニング アプローチの成功により、コン … 続きを読む

カテゴリー: cs.CV, cs.MM | CLIP Brings Better Features to Visual Aesthetics Learners はコメントを受け付けていません

Emotion4MIDI: a Lyrics-based Emotion-Labeled Symbolic Music Dataset

要約 12,000 の MIDI 曲から構成される新しい大規模な感情ラベル付き象 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.LG, cs.MM, eess.AS | Emotion4MIDI: a Lyrics-based Emotion-Labeled Symbolic Music Dataset はコメントを受け付けていません

Sample Less, Learn More: Efficient Action Recognition via Frame Feature Restoration

要約 効果的なビデオアクション認識モデルをトレーニングするには、特に限られたリソ … 続きを読む

カテゴリー: cs.CV, cs.MM | Sample Less, Learn More: Efficient Action Recognition via Frame Feature Restoration はコメントを受け付けていません

Self-Supervised Visual Acoustic Matching

要約 音響マッチングの目的は、オーディオ クリップを再合成して、ターゲットの音響 … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | Self-Supervised Visual Acoustic Matching はコメントを受け付けていません

SAS Video-QA: Self-Adaptive Sampling for Efficient Video Question-Answering

要約 ビデオの質問と回答は、ビデオ理解の分野における基本的なタスクです。 Vid … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.MM | SAS Video-QA: Self-Adaptive Sampling for Efficient Video Question-Answering はコメントを受け付けていません

WavJourney: Compositional Audio Creation with Large Language Models

要約 大規模言語モデル (LLM) は、複雑な言語と視覚のタスクに取り組むために … 続きを読む

カテゴリー: cs.AI, cs.MM, cs.SD, eess.AS | WavJourney: Compositional Audio Creation with Large Language Models はコメントを受け付けていません

A semantics-driven methodology for high-quality image annotation

要約 機械学習とコンピューター ビジョンの最近の研究では、グラウンド トゥルース … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | A semantics-driven methodology for high-quality image annotation はコメントを受け付けていません

Spectrum-guided Multi-granularity Referring Video Object Segmentation

要約 現在の参照ビデオ オブジェクト セグメンテーション (R-VOS) 技術は … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.MM | Spectrum-guided Multi-granularity Referring Video Object Segmentation はコメントを受け付けていません