要約
Pythonは、業界と教育で最も一般的に使用されるプログラミング言語の1つです。
その英語のキーワードと組み込みの機能/モジュールにより、読みやすさと執筆の容易さの点で擬似コードに近づくことができます。
しかし、英語を話さない人はこれらの利点を経験しないかもしれません。
実際、その用語の英語の性質がオーバーヘッドの追加層を作成するため、Pythonコードを理解する能力が妨げられることさえあります。
そのため、Pythonの自然なモダリティ(キーワード、エラータイプ、識別子など)を他の人間の言語に自動的に変換するタスクを紹介します。
これは、これらの形式の省略された性質と、言語間の高度な数学/プログラミングの概念の潜在的な翻訳性を考慮して、ユニークな課題を提示します。
したがって、自動化されたパイプラインを作成して、Pythonを他の人間の言語に変換し、機械翻訳と大規模な言語モデルを使用して戦略を比較します。
次に、このパイプラインを使用して、7つの言語で5つの一般的なPythonライブラリ(Pytorch、Pandas、Tensorflow、Numpy、およびランダム)から翻訳を取得し、フランス語、ギリシャ語、ベンガル語でこれらの用語のサブセットで品質テストを行います。
これが、国籍や言語の背景に関係なく、誰でもアクセスできるユニバーサルパイソンの作成に向けてより明確な道を提供することを願っています。
要約(オリジナル)
Python is one of the most commonly used programming languages in industry and education. Its English keywords and built-in functions/modules allow it to come close to pseudo-code in terms of its readability and ease of writing. However, those who do not speak English may not experience these advantages. In fact, they may even be hindered in their ability to understand Python code, as the English nature of its terms creates an additional layer of overhead. To that end, we introduce the task of automatically translating Python’s natural modality (keywords, error types, identifiers, etc.) into other human languages. This presents a unique challenge, considering the abbreviated nature of these forms, as well as potential untranslatability of advanced mathematical/programming concepts across languages. We therefore create an automated pipeline to translate Python into other human languages, comparing strategies using machine translation and large language models. We then use this pipeline to acquire translations from five common Python libraries (pytorch, pandas, tensorflow, numpy, and random) in seven languages, and do a quality test on a subset of these terms in French, Greek, and Bengali. We hope this will provide a clearer path forward towards creating a universal Python, accessible to anyone regardless of nationality or language background.
arxiv情報
著者 | Joshua Otten,Antonios Anastasopoulos,Kevin Moran |
発行日 | 2025-04-15 15:30:22+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google