「eess.AS」カテゴリーアーカイブ

Position Prediction as an Effective Pretraining Strategy

投稿日: 2022年7月18日作成者: jarxiv

要約トランスフォーマーは、その強力な表現能力により、自然言語処理（NLP）、コ … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

A Single Self-Supervised Model for Many Speech Modalities Enables Zero-Shot Modality Transfer

投稿日: 2022年7月15日作成者: jarxiv

要約視聴覚音声モデルは、音声のみのモデルと比較して優れたパフォーマンスと堅牢性 … 続きを読む →

カテゴリー: cs.AI, cs.CL, cs.CV, cs.SD, eess.AS, eess.IV | コメントを受け付けていません

Audio-Visual Segmentation

投稿日: 2022年7月12日作成者: jarxiv

要約視聴覚セグメンテーション（AVS）と呼ばれる新しい問題を調査することを提案 … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS, eess.IV | コメントを受け付けていません

FastLTS: Non-Autoregressive End-to-End Unconstrained Lip-to-Speech Synthesis

投稿日: 2022年7月11日作成者: jarxiv

要約制約のない唇から音声への合成は、頭のポーズや語彙に制限がなく、話している顔 … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.MM, cs.SD, eess.AS, I.2.10 | コメントを受け付けていません

Self-Supervised Learning of Music-Dance Representation through Explicit-Implicit Rhythm Synchronization

投稿日: 2022年7月8日作成者: jarxiv

要約視聴覚表現は多くの下流のタスクに適用可能であることが証明されていますが、よ … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Finding Fallen Objects Via Asynchronous Audio-Visual Integration

投稿日: 2022年7月8日作成者: jarxiv

要約オブジェクトの外観と音の仕方は、その物理的特性を補完的に反映しています。 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.RO, cs.SD, eess.AS | コメントを受け付けていません

Expression-preserving face frontalization improves visually assisted speech processing

投稿日: 2022年7月7日作成者: jarxiv

要約顔の正面化とは、任意の角度から見た顔から、正面から見た顔を合成することであ … 続きを読む →

カテゴリー: cs.CV, cs.SD, eess.AS | コメントを受け付けていません

VocaLiST: An Audio-Visual Synchronisation Model for Lips and Voices

投稿日: 2022年7月1日作成者: jarxiv

要約この論文では、人間の顔と声を含むビデオの唇と声の同期の問題に対処します。 … 続きを読む →

カテゴリー: cs.CV, cs.IR, cs.SD, eess.AS | コメントを受け付けていません

Show Me Your Face, And I’ll Tell You How You Speak

投稿日: 2022年6月29日作成者: jarxiv

要約私たちが話すとき、韻律とスピーチの内容は私たちの唇の動きから推測することが … 続きを読む →

カテゴリー: cs.CV, cs.SD, eess.AS, eess.IV | コメントを受け付けていません

Incorporating Voice Instructions in Model-Based Reinforcement Learning for Self-Driving Cars

投稿日: 2022年6月22日作成者: jarxiv

要約このペーパーでは、自動運転車をトレーニングする際に、自然言語の音声命令をサ … 続きを読む →

カテゴリー: cs.CL, cs.CV, cs.HC, cs.LG, cs.SD, eess.AS | コメントを受け付けていません