fastabx: A library for efficient computation of ABX discriminability

要約

ABX差別タスクを構築するための高性能PythonライブラリであるFastAbxを紹介します。
ABXは、関心のある一般的なカテゴリ間の分離の尺度です。
それは、自己教師の音声表現における音声識別性を評価するために広く使用されてきました。
ただし、その幅広い採用は、適切なツールがないために制限されています。
FASTABXは、タスクの作成と表現間の距離の計算の両方で、迅速な開発サイクルに必要な効率を提供しながら、あらゆるタイプのABXタスクを構築できるフレームワークを提供することにより、このギャップに対処します。
FastABXは、より広範な表現学習コミュニティにとって貴重なリソースとして機能し、研究者が音声処理以外のいくつかのドメインで学習した表現から直接抽出できる情報を体系的に調査できるようにすると考えています。
ソースコードは、https://github.com/bootphon/fastabxで入手できます。

要約(オリジナル)

We introduce fastabx, a high-performance Python library for building ABX discrimination tasks. ABX is a measure of the separation between generic categories of interest. It has been used extensively to evaluate phonetic discriminability in self-supervised speech representations. However, its broader adoption has been limited by the absence of adequate tools. fastabx addresses this gap by providing a framework capable of constructing any type of ABX task while delivering the efficiency necessary for rapid development cycles, both in task creation and in calculating distances between representations. We believe that fastabx will serve as a valuable resource for the broader representation learning community, enabling researchers to systematically investigate what information can be directly extracted from learned representations across several domains beyond speech processing. The source code is available at https://github.com/bootphon/fastabx.

arxiv情報

著者 Maxime Poli,Emmanuel Chemla,Emmanuel Dupoux
発行日 2025-05-05 14:43:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.SD, eess.AS パーマリンク