EvolveMT: an Ensemble MT Engine Improving Itself with Usage Only

要約

この文書では、複数の機械翻訳 (MT) エンジンを効率的に組み合わせるための EvolveMT について説明します。
提案されたシステムは、オンライン学習技術を利用してセグメントごとに単一のエンジンからの出力を選択し、あらゆる翻訳要求に最適なシステムを予測します。
ニューラル品質推定メトリックは、参照翻訳を必要とせずにメソッドを監視します。
このシステムのオンライン学習機能により、ドメインまたは機械翻訳エンジンの変更に動的に適応できるため、追加のトレーニングが不要になります。
EvolveMT は、ソース文の特徴に基づいて、呼び出す翻訳エンジンのサブセットを選択します。
探索の程度は、望ましい品質とコストのトレードオフに応じて構成できます。
カスタム データセットの結果は、EvolveMT が、MT 品質推定ツールを使用してすべての翻訳から各セグメントの最適な翻訳を選択するよりも、低コストで同様の翻訳精度を達成できることを示しています。
私たちの知る限り、EvolveMT は、人的フィードバックによるコストのかかる再トレーニングを必要とせず、導入後に運用環境から受信する翻訳リクエストに自動的に適応する初のメタ MT システムです。

要約(オリジナル)

This paper presents EvolveMT for efficiently combining multiple machine translation (MT) engines. The proposed system selects the output from a single engine for each segment by utilizing online learning techniques to predict the most suitable system for every translation request. A neural quality estimation metric supervises the method without requiring reference translations. The online learning capability of this system allows for dynamic adaptation to alterations in the domain or machine translation engines, thereby obviating the necessity for additional training. EvolveMT selects a subset of translation engines to be called based on the source sentence features. The degree of exploration is configurable according to the desired quality-cost trade-off. Results from custom datasets demonstrate that EvolveMT achieves similar translation accuracy at a lower cost than selecting the best translation of each segment from all translations using an MT quality estimator. To our knowledge, EvolveMT is the first meta MT system that adapts itself after deployment to incoming translation requests from the production environment without needing costly retraining on human feedback.

arxiv情報

著者 Kamer Ali Yuksel,Ahmet Gunduz,Mohamed Al-Badrashiny,Shreyas Sharma,Hassan Sawaf
発行日 2023-06-20 18:32:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク