eess.AS」カテゴリーアーカイブ

The Interpreter Understands Your Meaning: End-to-end Spoken Language Understanding Aided by Speech Translation

要約 エンドツーエンドの音声言語理解 (SLU) は、テキストと音声に関する現在 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | The Interpreter Understands Your Meaning: End-to-end Spoken Language Understanding Aided by Speech Translation はコメントを受け付けていません

Fast-FNet: Accelerating Transformer Encoder Models via Efficient Fourier Layers

要約 Transformer ベースの言語モデルは、アテンション メカニズムを利 … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.GL, eess.AS | Fast-FNet: Accelerating Transformer Encoder Models via Efficient Fourier Layers はコメントを受け付けていません

Low-complexity deep learning frameworks for acoustic scene classification using teacher-student scheme and multiple spectrograms

要約 この技術レポートでは、音響シーン分類 (ASC) のための低複雑性の深層学 … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Low-complexity deep learning frameworks for acoustic scene classification using teacher-student scheme and multiple spectrograms はコメントを受け付けていません

Discrete Diffusion Probabilistic Models for Symbolic Music Generation

要約 ノイズ除去拡散確率モデル (DDPM) は、離散領域と連続領域の両方で高品 … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Discrete Diffusion Probabilistic Models for Symbolic Music Generation はコメントを受け付けていません

Listen, Denoise, Action! Audio-Driven Motion Synthesis with Diffusion Models

要約 拡散モデルは、表現力が高く、効率的にトレーニングできる確率モデルとして注目 … 続きを読む

カテゴリー: 68T07, cs.CV, cs.GR, cs.HC, cs.LG, cs.SD, eess.AS, G.3 | Listen, Denoise, Action! Audio-Driven Motion Synthesis with Diffusion Models はコメントを受け付けていません

Uncertainty Estimation in Deep Speech Enhancement Using Complex Gaussian Mixture Models

要約 シングルチャネルのディープスピーチエンハンスメント手法では、多くの場合、精 … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Uncertainty Estimation in Deep Speech Enhancement Using Complex Gaussian Mixture Models はコメントを受け付けていません

Integrating Uncertainty into Neural Network-based Speech Enhancement

要約 時間周波数領域における教師ありマスキング アプローチは、ディープ ニューラ … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Integrating Uncertainty into Neural Network-based Speech Enhancement はコメントを受け付けていません

Automated Audio Captioning and Language-Based Audio Retrieval

要約 このプロジェクトには、(1) 自動音声キャプションと (2) 言語ベースの … 続きを読む

カテゴリー: cs.CL, cs.IR, cs.SD, eess.AS | Automated Audio Captioning and Language-Based Audio Retrieval はコメントを受け付けていません

CryCeleb: A Speaker Verification Dataset Based on Infant Cry Sounds

要約 本論文では、Ubenwa CryCelebデータセット(乳児の泣き声のラベ … 続きを読む

カテゴリー: cs.AI, cs.CL, cs.SD, eess.AS | CryCeleb: A Speaker Verification Dataset Based on Infant Cry Sounds はコメントを受け付けていません

Benchmarks and leaderboards for sound demixing tasks

要約 音楽デミックスとは、与えられた単一のオーディオ信号から、ドラム、ベース、ボ … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS | Benchmarks and leaderboards for sound demixing tasks はコメントを受け付けていません