eess.AS」カテゴリーアーカイブ

The mutual exclusivity bias of bilingual visually grounded speech models

要約 相互排他性(私)は、おなじみの言葉ではなく、子供の言語学習を促進するのでは … 続きを読む

カテゴリー: cs.CL, eess.AS | The mutual exclusivity bias of bilingual visually grounded speech models はコメントを受け付けていません

Acoustically Precise Hesitation Tagging Is Essential for End-to-End Verbatim Transcription Systems

要約 自動スピーキング評価のための逐語的転写は、エラー分析やフィードバックなどの … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Acoustically Precise Hesitation Tagging Is Essential for End-to-End Verbatim Transcription Systems はコメントを受け付けていません

A Novel Data Augmentation Approach for Automatic Speaking Assessment on Opinion Expressions

要約 意見表現に関する自動スピーキング評価(ASA)は、ラベル付きの録音の希少性 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | A Novel Data Augmentation Approach for Automatic Speaking Assessment on Opinion Expressions はコメントを受け付けていません

UniCUE: Unified Recognition and Generation Framework for Chinese Cued Speech Video-to-Speech Generation

要約 手がかりのスピーチ(CS)は、ハンドコーディングを通じてリップリーディング … 続きを読む

カテゴリー: cs.CV, cs.SD, eess.AS | UniCUE: Unified Recognition and Generation Framework for Chinese Cued Speech Video-to-Speech Generation はコメントを受け付けていません

Sounding that Object: Interactive Object-Aware Image to Audio Generation

要約 複雑なオーディオビジュアルシーンに対して正確なサウンドを生成することは、特 … 続きを読む

カテゴリー: cs.CV, cs.LG, cs.MM, cs.SD, eess.AS | Sounding that Object: Interactive Object-Aware Image to Audio Generation はコメントを受け付けていません

Towards a Japanese Full-duplex Spoken Dialogue System

要約 全二重音声対話システムは、音声の重なりやバックチャネルといった人間の会話の … 続きを読む

カテゴリー: cs.CL, eess.AS | Towards a Japanese Full-duplex Spoken Dialogue System はコメントを受け付けていません

Improving Multilingual Speech Models on ML-SUPERB 2.0: Fine-tuning with Data Augmentation and LID-Aware CTC

要約 教師ありまたは教師ありで事前に学習された音声基礎モデル(SFM)を用いた多 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Improving Multilingual Speech Models on ML-SUPERB 2.0: Fine-tuning with Data Augmentation and LID-Aware CTC はコメントを受け付けていません

Egocentric Speaker Classification in Child-Adult Dyadic Interactions: From Sensing to Computational Modeling

要約 自閉症スペクトラム障害(ASD)は、社会的コミュニケーション、反復行動、お … 続きを読む

カテゴリー: cs.AI, cs.SD, eess.AS | Egocentric Speaker Classification in Child-Adult Dyadic Interactions: From Sensing to Computational Modeling はコメントを受け付けていません

Bemba Speech Translation: Exploring a Low-Resource African Language

要約 このホワイトペーパーでは、スポークン言語翻訳に関する国際会議(IWSLT … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Bemba Speech Translation: Exploring a Low-Resource African Language はコメントを受け付けていません

Efficient Speech Translation through Model Compression and Knowledge Distillation

要約 音声翻訳のための大規模なオーディオ言語モデルの効率的な展開は、重要な計算要 … 続きを読む

カテゴリー: cs.CL, cs.SD, eess.AS | Efficient Speech Translation through Model Compression and Knowledge Distillation はコメントを受け付けていません