Segmentation-Free Streaming Machine Translation

要約

ストリーミング機械翻訳 (MT) は、無制限の入力テキスト ストリームをリアルタイムで翻訳するタスクです。
自動音声認識 (ASR) と MT システムを組み合わせた従来のカスケード アプローチは、転写ストリームを文のような単位に分割する中間セグメンテーション ステップに依存しています。
ただし、ハード セグメンテーションを組み込むと MT システムが制約され、エラーの原因になります。
この論文では、翻訳が生成されるまでセグメンテーションの決定を遅らせることによって、モデルがセグメント化されていないソース ストリームを翻訳できるようにするセグメンテーション フリー フレームワークを提案します。
広範な実験により、提案されたセグメンテーションフリー フレームワークが、独立したセグメンテーション モデルを使用する競合アプローチよりも品質と遅延のトレードオフがどのように優れているかが示されています。
ソフトウェア、データ、モデルは書類の受理後にリリースされます。

要約(オリジナル)

Streaming Machine Translation (MT) is the task of translating an unbounded input text stream in real-time. The traditional cascade approach, which combines an Automatic Speech Recognition (ASR) and an MT system, relies on an intermediate segmentation step which splits the transcription stream into sentence-like units. However, the incorporation of a hard segmentation constrains the MT system and is a source of errors. This paper proposes a Segmentation-Free framework that enables the model to translate an unsegmented source stream by delaying the segmentation decision until the translation has been generated. Extensive experiments show how the proposed Segmentation-Free framework has better quality-latency trade-off than competing approaches that use an independent segmentation model. Software, data and models will be released upon paper acceptance.

arxiv情報

著者 Javier Iranzo-Sánchez,Jorge Iranzo-Sánchez,Adrià Giménez,Jorge Civera,Alfons Juan
発行日 2023-09-26 10:43:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク