eess.AS」カテゴリーアーカイブ

Late multimodal fusion for image and audio music transcription

要約 音楽ソースを構造化されたデジタル形式に変換する音楽のトランスクリプションは … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.MM, cs.SD, eess.AS, I.4 | Late multimodal fusion for image and audio music transcription はコメントを受け付けていません

Catch Me If You Hear Me: Audio-Visual Navigation in Complex Unmapped Environments with Moving Sounds

要約 視聴覚ナビゲーションは、視覚と聴覚を組み合わせて、マッピングされていない環 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.RO, cs.SD, eess.AS | Catch Me If You Hear Me: Audio-Visual Navigation in Complex Unmapped Environments with Moving Sounds はコメントを受け付けていません

Interpretable Multimodal Emotion Recognition using Hybrid Fusion of Speech and Image Data

要約 本稿では、音声発話と対応する画像によって表される感情を離散クラスに分類する … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | Interpretable Multimodal Emotion Recognition using Hybrid Fusion of Speech and Image Data はコメントを受け付けていません

In-Air Imaging Sonar Sensor Network with Real-Time Processing Using GPUs

要約 自律航法やロボットへの応用では、環境を正しく感知することが重要です。 この … 続きを読む

カテゴリー: cs.CV, cs.NI, eess.AS | In-Air Imaging Sonar Sensor Network with Real-Time Processing Using GPUs はコメントを受け付けていません

StyleTalker: One-shot Style-based Audio-driven Talking Head Video Generation

要約 StyleTalker は、正確にオーディオ同期された唇の形、リアルな頭の … 続きを読む

カテゴリー: cs.CV, cs.LG, eess.AS, eess.IV | StyleTalker: One-shot Style-based Audio-driven Talking Head Video Generation はコメントを受け付けていません

Everything at Once — Multi-modal Fusion Transformer for Video Retrieval

要約 ビデオ データからのマルチモーダル学習は、ゼロ ショット検索や分類などのタ … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.SD, eess.AS | Everything at Once — Multi-modal Fusion Transformer for Video Retrieval はコメントを受け付けていません

Exploiting Transformation Invariance and Equivariance for Self-supervised Sound Localisation

要約 ビデオの音源をローカライズするために、オーディオビジュアル表現学習のための … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | Exploiting Transformation Invariance and Equivariance for Self-supervised Sound Localisation はコメントを受け付けていません

Hybrid Multimodal Feature Extraction, Mining and Fusion for Sentiment Analysis

要約 このホワイト ペーパーでは、MuSe-Humor、MuSe-Reactio … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.SD, eess.AS, eess.IV | Hybrid Multimodal Feature Extraction, Mining and Fusion for Sentiment Analysis はコメントを受け付けていません

Late multimodal fusion for image and audio music transcription

要約 音楽ソースを構造化されたデジタル形式に変換する音楽のトランスクリプションは … 続きを読む

カテゴリー: cs.CV, cs.IR, cs.MM, cs.SD, eess.AS, I.4 | Late multimodal fusion for image and audio music transcription はコメントを受け付けていません

An Intensity and Phase Stacked Analysis of Phase-OTDR System using Deep Transfer Learning and Recurrent Neural Networks

要約 分散型音響センサ(DAS)は、光ファイバに沿って様々な事象の信号を非常に高 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | An Intensity and Phase Stacked Analysis of Phase-OTDR System using Deep Transfer Learning and Recurrent Neural Networks はコメントを受け付けていません