「eess.AS」カテゴリーアーカイブ

MoMuSE: Momentum Multi-modal Target Speaker Extraction for Real-time Scenarios with Impaired Visual Cues

投稿日: 2025年4月1日作成者: jarxiv

要約オーディオビジュアルターゲットスピーカー抽出（AV-TSE）は、時間同期さ … 続きを読む →

カテゴリー: cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Audio-Plane: Audio Factorization Plane Gaussian Splatting for Real-Time Talking Head Synthesis

投稿日: 2025年3月31日作成者: jarxiv

要約トーキングヘッド合成は、コンピューターグラフィックスとマルチメディアの重要 … 続きを読む →

カテゴリー: cs.CV, cs.GR, cs.SD, eess.AS | コメントを受け付けていません

Whistle: Data-Efficient Multilingual and Crosslingual Speech Recognition via Weakly Phonetic Supervision

投稿日: 2025年3月28日作成者: jarxiv

要約多言語および相互自動音声認識（MCL-ASR） – 音声または … 続きを読む →

カテゴリー: cs.CL, cs.SD, eess.AS | コメントを受け付けていません

Magnitude-Phase Dual-Path Speech Enhancement Network based on Self-Supervised Embedding and Perceptual Contrast Stretch Boosting

投稿日: 2025年3月28日作成者: jarxiv

要約スピーチの自己学習学習（SSL）は、さまざまな音声処理タスクで大きな進歩を … 続きを読む →

カテゴリー: cs.AI, cs.SD, eess.AS | コメントを受け付けていません

Benchmarking Machine Learning Methods for Distributed Acoustic Sensing

投稿日: 2025年3月27日作成者: jarxiv

要約分散音響センシング（DAS）テクノロジーは、光ファイバーに沿った微小摂動の … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.SD, eess.AS | コメントを受け付けていません

Zero-Shot Audio-Visual Editing via Cross-Modal Delta Denoising

投稿日: 2025年3月27日作成者: jarxiv

要約このペーパーでは、ゼロショットオーディオビデオ編集を紹介します。これは、追 … 続きを読む →

カテゴリー: cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

Seeing Speech and Sound: Distinguishing and Locating Audios in Visual Scenes

投稿日: 2025年3月25日作成者: jarxiv

要約視覚シーン内の音声言語と非スピーチの両方の音の両方を同時に接地できる統合モ … 続きを読む →

カテゴリー: cs.CV, cs.SD, eess.AS | コメントを受け付けていません

United we stand, Divided we fall: Handling Weak Complementary Relationships for Audio-Visual Emotion Recognition in Valence-Arousal Space

投稿日: 2025年3月24日作成者: jarxiv

要約オーディオとビジュアルモダリティは、ビデオの2つの主要な接触チャネルであり … 続きを読む →

カテゴリー: cs.CV, cs.SD, eess.AS | コメントを受け付けていません

Align Your Rhythm: Generating Highly Aligned Dance Poses with Gating-Enhanced Rhythm-Aware Feature Representation

投稿日: 2025年3月24日作成者: jarxiv

要約音楽によって駆動される自然で多様でリズミカルな人間のダンスの動きを自動的に … 続きを読む →

カテゴリー: cs.AI, cs.CV, cs.MM, cs.SD, eess.AS | コメントを受け付けていません

emg2qwerty: A Large Dataset with Baselines for Touch Typing using Surface Electromyography

投稿日: 2025年3月21日作成者: jarxiv

要約表面筋電図（SEMG）は、個々の脊椎ニューロンと豊かさを検出するのに十分な … 続きを読む →

カテゴリー: cs.HC, cs.LG, eess.AS, H.1.2 | コメントを受け付けていません