要約
効果的なコミュニケーションはあらゆる対話の基本ですが、参加者が共通の言語を共有していない場合には課題が生じます。
自動翻訳システムは、このようなシナリオで言語の壁を埋める強力なソリューションを提供しますが、誤解や会話の中断につながる可能性のあるエラーが発生します。
重要な問題は、現在のシステムが曖昧さや省略された詳細を解決するために必要な豊富な文脈情報を組み込んでおらず、その結果、文字通りの翻訳、不適切な翻訳、または不整合な翻訳が生じることです。
この研究では、バイリンガルの会話設定にコンテキスト情報を組み込むことで、大規模な言語モデルベースの翻訳システムを改善するフレームワークを紹介します。
トレーニング中に、コンテキスト拡張された並列データを活用することで、モデルが会話履歴に応じた翻訳を生成できるようになります。
推論中に、コンテキストを意識したメトリクスを使用して品質を意識したデコードを実行し、候補のプールから最適な翻訳を選択します。
私たちは、顧客チャットとユーザー アシスタントの対話という 2 つのタスク指向ドメインでフレームワークの両方のコンポーネントを検証します。
どちらの設定でも、複数の言語ペアにおける複数の自動翻訳品質指標によって測定されるように、当社のフレームワークは GPT-4o や TowerInstruct などの最先端のシステムよりも一貫して優れた翻訳を実現します。
また、結果のモデルが意図された解釈可能な方法でコンテキストを活用し、伝達されるメッセージと生成された翻訳の間の一貫性が向上することも示します。
要約(オリジナル)
Effective communication is fundamental to any interaction, yet challenges arise when participants do not share a common language. Automatic translation systems offer a powerful solution to bridge language barriers in such scenarios, but they introduce errors that can lead to misunderstandings and conversation breakdown. A key issue is that current systems fail to incorporate the rich contextual information necessary to resolve ambiguities and omitted details, resulting in literal, inappropriate, or misaligned translations. In this work, we present a framework to improve large language model-based translation systems by incorporating contextual information in bilingual conversational settings. During training, we leverage context-augmented parallel data, which allows the model to generate translations sensitive to conversational history. During inference, we perform quality-aware decoding with context-aware metrics to select the optimal translation from a pool of candidates. We validate both components of our framework on two task-oriented domains: customer chat and user-assistant interaction. Across both settings, our framework consistently results in better translations than state-of-the-art systems like GPT-4o and TowerInstruct, as measured by multiple automatic translation quality metrics on several language pairs. We also show that the resulting model leverages context in an intended and interpretable way, improving consistency between the conveyed message and the generated translations.
arxiv情報
著者 | José Pombal,Sweta Agrawal,Patrick Fernandes,Emmanouil Zaranis,André F. T. Martins |
発行日 | 2024-12-05 14:41:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google