Design of an Open-Source Architecture for Neural Machine Translation

要約

adaptNMT は、リカレント ニューラル ネットワークとトランスフォーマー モデルの開発と展開に対する合理化されたアプローチを提供するオープンソース アプリケーションです。
このアプリケーションは、広く採用されている OpenNMT エコシステムに基づいて構築されており、開発環境のセットアップとトレーニング、検証、およびテスト分割の作成が簡素化されるため、この分野への新規参入者にとって特に役立ちます。
このアプリケーションは、モデル トレーニングの進行状況を示すグラフ機能を提供し、サブワード セグメンテーション モデルの作成に SentencePiece を使用します。
さらに、このアプリケーションは、ハイパーパラメーターのカスタマイズを容易にする直感的なユーザー インターフェイスを提供します。
注目すべき点は、シングルクリックのモデル開発アプローチが実装されており、adaptNMT によって開発されたモデルをさまざまなメトリクスを使用して評価できることです。
環境に優しい研究を促進するために、adaptNMT には、モデル開発中に生成される電力消費量と kgCO${_2}$ 排出量を示すグリーン レポートが組み込まれています。
アプリケーションは無料で利用できます。

要約(オリジナル)

adaptNMT is an open-source application that offers a streamlined approach to the development and deployment of Recurrent Neural Networks and Transformer models. This application is built upon the widely-adopted OpenNMT ecosystem, and is particularly useful for new entrants to the field, as it simplifies the setup of the development environment and creation of train, validation, and test splits. The application offers a graphing feature that illustrates the progress of model training, and employs SentencePiece for creating subword segmentation models. Furthermore, the application provides an intuitive user interface that facilitates hyperparameter customization. Notably, a single-click model development approach has been implemented, and models developed by adaptNMT can be evaluated using a range of metrics. To encourage eco-friendly research, adaptNMT incorporates a green report that flags the power consumption and kgCO${_2}$ emissions generated during model development. The application is freely available.

arxiv情報

著者 Séamus Lankford,Haithem Afli,Andy Way
発行日 2024-03-06 09:57:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク