eess.AS」カテゴリーアーカイブ

General-purpose, long-context autoregressive modeling with Perceiver AR

要約 実世界のデータは高次元です。本、画像、または音楽のパフォーマンスには、圧縮 … 続きを読む

カテゴリー: cs.AI, cs.CV, cs.LG, cs.SD, eess.AS | General-purpose, long-context autoregressive modeling with Perceiver AR はコメントを受け付けていません

Learning Speaker-specific Lip-to-Speech Generation

要約 唇の動きを理解し、それからスピーチを推測することは、一般の人にとって悪名高 … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | Learning Speaker-specific Lip-to-Speech Generation はコメントを受け付けていません

M2FNet: Multi-modal Fusion Network for Emotion Recognition in Conversation

要約 会話における感情認識(ERC)は、交感神経の人間と機械の相互作用を発達させ … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | M2FNet: Multi-modal Fusion Network for Emotion Recognition in Conversation はコメントを受け付けていません

Canonical Cortical Graph Neural Networks and its Application for Speech Enhancement in Future Audio-Visual Hearing Aids

要約 近年の機械学習アルゴリズムの成功にもかかわらず、これらのモデルの多くは、マ … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | Canonical Cortical Graph Neural Networks and its Application for Speech Enhancement in Future Audio-Visual Hearing Aids はコメントを受け付けていません

FedNST: Federated Noisy Student Training for Automatic Speech Recognition

要約 Federated Learning (FL) は、分散システムにおいて、 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.CV, cs.DC, cs.LG, eess.AS, I.2.11 | FedNST: Federated Noisy Student Training for Automatic Speech Recognition はコメントを受け付けていません

Few-Shot Audio-Visual Learning of Environment Acoustics

要約 ルームインパルス応答(RIR)関数は、周囲の物理環境がリスナーに聞こえる音 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | Few-Shot Audio-Visual Learning of Environment Acoustics はコメントを受け付けていません

Face-Dubbing++: Lip-Synchronous, Voice Preserving Translation of Videos

要約 本論文では、映像の音声保存、リップシンクロ翻訳のためのニューラルエンドツー … 続きを読む

カテゴリー: cs.CL, cs.CV, cs.SD, eess.AS, eess.IV | Face-Dubbing++: Lip-Synchronous, Voice Preserving Translation of Videos はコメントを受け付けていません

Tagged-MRI Sequence to Audio Synthesis via Self Residual Attention Guided Heterogeneous Translator

要約 タグ付きMRIに見られる舌や中咽頭筋の変形と明瞭な音声の関係を理解すること … 続きを読む

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | Tagged-MRI Sequence to Audio Synthesis via Self Residual Attention Guided Heterogeneous Translator はコメントを受け付けていません