Improving Stability in Simultaneous Speech Translation: A Revision-Controllable Decoding Approach

要約

Speech-to-Text の同時翻訳は、リアルタイムの異言語コミュニケーションにおいて重要な役割を果たします。
近年の進歩にも関わらず、翻訳プロセスの安定性を達成する上での課題は依然として残されており、その懸念は主に部分的な結果のちらつきに現れます。
この論文では、この問題に対処するために設計された新しいリビジョン制御可能な方法を提案します。
私たちの方法では、ビーム検索枝刈りプロセス内に許容される改訂ウィンドウを導入して、大規模な改訂を引き起こす可能性のある候補翻訳を選別し、ちらつきの大幅な削減につながり、そして重要なことに、ちらつきを完全に排除する機能を提供します。
実験は、提案された方法が翻訳品質を実質的に損なうことなく復号化の安定性を大幅に改善できることを実証しています。

要約(オリジナル)

Simultaneous Speech-to-Text translation serves a critical role in real-time crosslingual communication. Despite the advancements in recent years, challenges remain in achieving stability in the translation process, a concern primarily manifested in the flickering of partial results. In this paper, we propose a novel revision-controllable method designed to address this issue. Our method introduces an allowed revision window within the beam search pruning process to screen out candidate translations likely to cause extensive revisions, leading to a substantial reduction in flickering and, crucially, providing the capability to completely eliminate flickering. The experiments demonstrate the proposed method can significantly improve the decoding stability without compromising substantially on the translation quality.

arxiv情報

著者 Junkun Chen,Jian Xue,Peidong Wang,Jing Pan,Jinyu Li
発行日 2023-10-06 17:48:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク