eess.AS」カテゴリーアーカイブ

SpeechBlender: Speech Augmentation Framework for Mispronunciation Data Generation

要約 ラベル付きの第 2 言語 (L2) 音声データの欠如は、発音間違い検出モデ … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | SpeechBlender: Speech Augmentation Framework for Mispronunciation Data Generation はコメントを受け付けていません

Contextualized End-to-End Speech Recognition with Contextual Phrase Prediction Network

要約 コンテキスト情報は音声認識技術において重要な役割を果たしており、それをエン … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Contextualized End-to-End Speech Recognition with Contextual Phrase Prediction Network はコメントを受け付けていません

MARBLE: Music Audio Representation Benchmark for Universal Evaluation

要約 画像生成やフィクションの共同制作など、アートと人工知能 (AI) が広範に … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS | MARBLE: Music Audio Representation Benchmark for Universal Evaluation はコメントを受け付けていません

VampNet: Music Generation via Masked Acoustic Token Modeling

要約 音楽の合成、圧縮、修復、バリエーションに対するマスクされた音響トークン モ … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | VampNet: Music Generation via Masked Acoustic Token Modeling はコメントを受け付けていません

What do End-to-End Speech Models Learn about Speaker, Language and Channel Information? A Layer-wise and Neuron-level Analysis

要約 ディープ ニューラル ネットワークは本質的に不透明で、解釈が困難です。 手 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | What do End-to-End Speech Models Learn about Speaker, Language and Channel Information? A Layer-wise and Neuron-level Analysis はコメントを受け付けていません

Improving RNN-Transducers with Acoustic LookAhead

要約 RNN トランスデューサ (RNN-T) は、その高精度とストリーミング機 … 続きを読む

カテゴリー: cs.CL, cs.LG, eess.AS | Improving RNN-Transducers with Acoustic LookAhead はコメントを受け付けていません

LegoNN: Building Modular Encoder-Decoder Models

要約 最先端のエンコーダ/デコーダ モデル (例: 機械翻訳 (MT) や自動音 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | LegoNN: Building Modular Encoder-Decoder Models はコメントを受け付けていません

On the Effectiveness of Speech Self-supervised Learning for Music

要約 自己教師あり学習 (SSL) は、さまざまな音声および自然言語処理アプリケ … 続きを読む

カテゴリー: cs.AI, cs.LG, cs.SD, eess.AS | On the Effectiveness of Speech Self-supervised Learning for Music はコメントを受け付けていません

ProgGP: From GuitarPro Tablature Neural Generation To Progressive Metal Production

要約 シンボリック音楽生成の分野における最近の研究では、入力および出力表現として … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | ProgGP: From GuitarPro Tablature Neural Generation To Progressive Metal Production はコメントを受け付けていません

EchoVest: Real-Time Sound Classification and Depth Perception Expressed through Transcutaneous Electrical Nerve Stimulation

要約 世界中で 15 億人以上の人々が聴覚障害を抱えて暮らしています。 このよう … 続きを読む

カテゴリー: cs.LG, cs.SD, eess.AS, eess.SP | EchoVest: Real-Time Sound Classification and Depth Perception Expressed through Transcutaneous Electrical Nerve Stimulation はコメントを受け付けていません