TACTIC: Translation Agents with Cognitive-Theoretic Interactive Collaboration

要約

機械の翻訳は、長い間、自然言語処理の中心的な課題でした。
大規模な言語モデル(LLMS)の急速な進歩により、翻訳の質には顕著な進歩がありました。
ただし、LLMSの翻訳の可能性を完全に認識することは、未解決の課題のままです。
最近の研究では、複雑な翻訳タスクを共同サブタスクに分解するためのマルチエージェントシステムを調査し、エージェントの協力と専門化を通じて翻訳品質を高めることにおける最初の約束を示しています。
それにもかかわらず、既存のマルチエージェント翻訳フレームワークは、認知翻訳研究からの基本的な洞察をほとんど無視しています。
これらの洞察は、人間の翻訳者が、文字通りと自由な翻訳のバランスをとる、コンテキストに基づいた表現を改良するなど、さまざまな認知戦略をどのように採用しているかを強調しています。
この制限に対処するために、Tacticと呼ばれる認知的に情報に基づいたマルチエージェントフレームワークを提案します。これは、認知的な熱気インタラクティブコラボレーションを備えたTANSLATION A A GENTSを表します。
フレームワークは、人間の翻訳行動で観察される重要な認知プロセスを反映する6つの機能的に異なるエージェントで構成されています。
これらには、起草、洗練、評価、スコアリング、コンテキスト推論、および外部の知識収集のためのエージェントが含まれます。
インタラクティブで理論に基づいた翻訳ワークフローをシミュレートすることにより、戦術は高品質の翻訳のためにLLMの全容量を効果的に活用します。
Flores-200およびWMT24ベンチマークからの多様な言語ペアに関する実験結果は、この方法が常に最先端のパフォーマンスを達成することを示しています。
DeepSeek-V3を基本モデルとして使用すると、戦術はGPT-4.1を平均+0.6 Xcometと+1.18 CometKiwi-23で上回ります。
DeepSeek-R1と比較して、さらに+0.84 Xcometおよび+2.99 Cometkiwi-23により改善されます。
コードはhttps://github.com/weiyali126/tacticで入手できます。

要約(オリジナル)

Machine translation has long been a central task in natural language processing. With the rapid advancement of large language models (LLMs), there has been remarkable progress in translation quality. However, fully realizing the translation potential of LLMs remains an open challenge. Recent studies have explored multi-agent systems to decompose complex translation tasks into collaborative subtasks, showing initial promise in enhancing translation quality through agent cooperation and specialization. Nevertheless, existing multi-agent translation frameworks largely neglect foundational insights from cognitive translation studies. These insights emphasize how human translators employ different cognitive strategies, such as balancing literal and free translation, refining expressions based on context, and iteratively evaluating outputs. To address this limitation, we propose a cognitively informed multi-agent framework called TACTIC, which stands for T ranslation A gents with Cognitive- T heoretic Interactive Collaboration. The framework comprises six functionally distinct agents that mirror key cognitive processes observed in human translation behavior. These include agents for drafting, refinement, evaluation, scoring, context reasoning, and external knowledge gathering. By simulating an interactive and theory-grounded translation workflow, TACTIC effectively leverages the full capacity of LLMs for high-quality translation. Experimental results on diverse language pairs from the FLORES-200 and WMT24 benchmarks show that our method consistently achieves state-of-the-art performance. Using DeepSeek-V3 as the base model, TACTIC surpasses GPT-4.1 by an average of +0.6 XCOMET and +1.18 COMETKIWI-23. Compared to DeepSeek-R1, it further improves by +0.84 XCOMET and +2.99 COMETKIWI-23. Code is available at https://github.com/weiyali126/TACTIC.

arxiv情報

著者 Weiya Li,Junjie Chen,Bei Li,Boyang Liu,Zichen Wen,Nuanqiao Shan,Xiaoqian Liu,Anping Liu,Huajie Liu,Hu Song,Linfeng Zhang
発行日 2025-06-11 15:57:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク