Considerations for Ethical Speech Recognition Datasets

要約

タイトル:公正な音声認識データセットに関する考慮事項
要約:
-音声AI技術は一般に公開されているデータセットまたは大量のウェブクローリングによって訓練されます。
-両方の場合、データ収集は収集努力を最小限に抑えることに焦点を当てており、データ主体の保護やユーザーのニーズを考慮することが必ずしもされていません。
-これにより、訓練セットの支配的な人口統計から逸脱するユーザーに使用されるときに堅牢性に欠け、方言、アクセント、話し方、言葉のとぎれなど、異なる特徴を持つ個人に対して差別的になるようなモデルが生まれてしまいます。
-本発表では、自動音声認識を事例として、公正な音声データセットが責任あるAIアプリケーションに対して持つべき特性を検討します。
-我々は、使用者の人口統計およびニーズに対応したターゲットデータサンプリング、モデルの故障の場合に説明および責任の保障を保証する適切なメタデータ、社会技術および状況に応じたモデル設計、データ主体の法的およびプライバシー保護などについて主張します。
-我々は、より人間中心のデータセットを設計し、スピーチテクノロジーなどの領域で研究者や実践者がそれらを使用することを奨励し、ユーザーを強化し尊重しながら、機械学習モデルの堅牢性と有用性を向上することができるようになることを望んでいます。

要約(オリジナル)

Speech AI Technologies are largely trained on publicly available datasets or by the massive web-crawling of speech. In both cases, data acquisition focuses on minimizing collection effort, without necessarily taking the data subjects’ protection or user needs into consideration. This results to models that are not robust when used on users who deviate from the dominant demographics in the training set, discriminating individuals having different dialects, accents, speaking styles, and disfluencies. In this talk, we use automatic speech recognition as a case study and examine the properties that ethical speech datasets should possess towards responsible AI applications. We showcase diversity issues, inclusion practices, and necessary considerations that can improve trained models, while facilitating model explainability and protecting users and data subjects. We argue for the legal & privacy protection of data subjects, targeted data sampling corresponding to user demographics & needs, appropriate meta data that ensure explainability & accountability in cases of model failure, and the sociotechnical \& situated model design. We hope this talk can inspire researchers \& practitioners to design and use more human-centric datasets in speech technologies and other domains, in ways that empower and respect users, while improving machine learning models’ robustness and utility.

arxiv情報

著者 Orestis Papakyriakopoulos,Alice Xiang
発行日 2023-05-03 12:38:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL, cs.CY, cs.SD, eess.AS パーマリンク