Developing automatic verbatim transcripts for international multilingual meetings: an end-to-end solution

要約

このペーパーでは、完全に自動化された会議の議事録を作成し、それらをさまざまな言語に機械翻訳するためのエンドツーエンドのソリューションを紹介します。
このツールは、社内で開発された音声テキスト変換 (S2T) および機械翻訳 (MT) コンポーネントを使用して、世界知的所有権機関 (WIPO) で開発されました。
このホワイトペーパーでは、高度にカスタマイズされた堅牢なシステムを実現するデータ収集と微調整について説明するだけでなく、技術コンポーネントのアーキテクチャと進化について説明し、ユーザー側からのビジネスへの影響とメリットについても強調します。
また、システムの進化と導入における特定の課題と、新しいアプローチがどのように新しい製品を生み出し、会議管理文書内の既存の確立されたワークフローを置き換えたかについても指摘します。

要約(オリジナル)

This paper presents an end-to-end solution for the creation of fully automated conference meeting transcripts and their machine translations into various languages. This tool has been developed at the World Intellectual Property Organization (WIPO) using in-house developed speech-to-text (S2T) and machine translation (MT) components. Beyond describing data collection and fine-tuning, resulting in a highly customized and robust system, this paper describes the architecture and evolution of the technical components as well as highlights the business impact and benefits from the user side. We also point out particular challenges in the evolution and adoption of the system and how the new approach created a new product and replaced existing established workflows in conference management documentation.

arxiv情報

著者 Akshat Dewan,Michal Ziemski,Henri Meylan,Lorenzo Concina,Bruno Pouliquen
発行日 2023-09-27 12:16:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク