The CHiME-7 DASR Challenge: Distant Meeting Transcription with Multiple Devices in Diverse Scenarios

要約

CHiME の課題は、堅牢な自動音声認識 (ASR) システムの開発と評価において重要な役割を果たしてきました。
7 番目の CHiME チャレンジ内で、CHiME-7 遠隔 ASR (DASR) タスクを紹介します。
このタスクには、複数の、場合によっては異種の記録デバイスを使用した遠距離環境設定での共同 ASR および日記化が含まれます。
これまでの課題とは異なり、CHiME-6、DiPCo、Mixer 6 という 3 つの多様なシナリオでシステムを評価します。目標は、参加者が、事前情報なしでさまざまなアレイ形状やユースケースにわたって一般化できる単一のシステムを考案することです。
以前の CHiME イテレーションからのもう 1 つの違いは、参加者がオープンソースの事前トレーニング済みモデルとデータセットを使用できることです。
この論文では、課題の設計、動機、および基礎的な研究の質問について詳しく説明します。
また、完全にアレイ トポロジに依存せず、マルチチャネル ダイアライゼーション、チャネル選択、ガイド付きソース分離、および自己教師あり音声表現 (SSLR) を活用した堅牢な ASR モデルを備えたベースライン システムも紹介します。

要約(オリジナル)

The CHiME challenges have played a significant role in the development and evaluation of robust automatic speech recognition (ASR) systems. We introduce the CHiME-7 distant ASR (DASR) task, within the 7th CHiME challenge. This task comprises joint ASR and diarization in far-field settings with multiple, and possibly heterogeneous, recording devices. Different from previous challenges, we evaluate systems on 3 diverse scenarios: CHiME-6, DiPCo, and Mixer 6. The goal is for participants to devise a single system that can generalize across different array geometries and use cases with no a-priori information. Another departure from earlier CHiME iterations is that participants are allowed to use open-source pre-trained models and datasets. In this paper, we describe the challenge design, motivation, and fundamental research questions in detail. We also present the baseline system, which is fully array-topology agnostic and features multi-channel diarization, channel selection, guided source separation and a robust ASR model that leverages self-supervised speech representations (SSLR).

arxiv情報

著者 Samuele Cornell,Matthew Wiesner,Shinji Watanabe,Desh Raj,Xuankai Chang,Paola Garcia,Matthew Maciejewski,Yoshiki Masuyama,Zhong-Qiu Wang,Stefano Squartini,Sanjeev Khudanpur
発行日 2023-07-14 09:45:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.SD, eess.AS パーマリンク