Making Translators Privacy-aware on the User’s Side

要約

私たちは、機械翻訳システムのユーザーが自らの意思でデータのプライバシーを保護できるようにする PRISM を提案します。
プライバシー保護が必要なデータに機械翻訳システムを適用する需要が高まっています。
いくつかの機械翻訳エンジンはプライバシーを優先すると主張していますが、そのような保護の範囲と詳細はほとんど曖昧です。
まず、データがどのように、どの程度保護されるかが明確でないことがよくあります。
サービス プロバイダーが十分な安全対策を講じていると信じている場合でも、高度な攻撃者が機密情報を抽出する可能性があります。
第 2 に、通信チャネル内など、これらの保護手段の外側に脆弱性が存在し、データ漏洩につながる可能性があります。
その結果、ユーザーは高度なプライバシー保護が要求されるデータに対して機械翻訳エンジンを利用することを躊躇し、その利点を逃してしまいます。
PRISM はこの問題を解決します。
データを安全に保つために翻訳サービスに依存するのではなく、PRISM はユーザー側でデータを保護する手段を提供します。
このアプローチにより、プライバシー対策が不十分な機械翻訳エンジンでも安全に使用できるようになります。
すでにプライバシー保護機能が装備されているプラ​​ットフォームの場合、PRISM は追加の保護層として機能し、セキュリティをさらに強化します。
PRISM は、翻訳の精度を大幅に損なうことなく、これらのプライバシー機能を追加します。
私たちの実験では、実際のトランスレータである T5 と ChatGPT (GPT-3.5-turbo)、および 2 つの言語のデータセットを使用して PRISM の有効性を実証しています。
PRISM は、プライバシー保護と翻訳精度のバランスを効果的に高めます。

要約(オリジナル)

We propose PRISM to enable users of machine translation systems to preserve the privacy of data on their own initiative. There is a growing demand to apply machine translation systems to data that require privacy protection. While several machine translation engines claim to prioritize privacy, the extent and specifics of such protection are largely ambiguous. First, there is often a lack of clarity on how and to what degree the data is protected. Even if service providers believe they have sufficient safeguards in place, sophisticated adversaries might still extract sensitive information. Second, vulnerabilities may exist outside of these protective measures, such as within communication channels, potentially leading to data leakage. As a result, users are hesitant to utilize machine translation engines for data demanding high levels of privacy protection, thereby missing out on their benefits. PRISM resolves this problem. Instead of relying on the translation service to keep data safe, PRISM provides the means to protect data on the user’s side. This approach ensures that even machine translation engines with inadequate privacy measures can be used securely. For platforms already equipped with privacy safeguards, PRISM acts as an additional protection layer, reinforcing their security furthermore. PRISM adds these privacy features without significantly compromising translation accuracy. Our experiments demonstrate the effectiveness of PRISM using real-world translators, T5 and ChatGPT (GPT-3.5-turbo), and the datasets with two languages. PRISM effectively balances privacy protection with translation accuracy.

arxiv情報

著者 Ryoma Sato
発行日 2023-12-07 06:23:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.CR, cs.LG パーマリンク