Nemotron-4 340B Technical Report

要約

Nemotron-4-340B-Base、Nemotron-4-340B-Instruct、Nemotron-4-340B-Reward を含む Nemotron-4 340B モデル ファミリをリリースします。
当社のモデルは、モデルとその出力の配布、変更、使用を許可する寛容なモデル ライセンスである NVIDIA オープン モデル ライセンス契約に基づくオープン アクセスです。
これらのモデルは、幅広い評価ベンチマークでオープン アクセス モデルと競合する性能を発揮し、FP8 精度で展開した場合に 8 GPU を搭載した単一の DGX H100 に適合するサイズに設計されています。
私たちは、コミュニティがさまざまな研究研究や商用アプリケーション、特に小規模な言語モデルをトレーニングするための合成データを生成する場合に、これらのモデルから恩恵を受けることができると信じています。
特に、モデル調整プロセスで使用されるデータの 98% 以上が合成的に生成されており、合成データの生成におけるこれらのモデルの有効性が示されています。
オープンリサーチをさらにサポートし、モデル開発を促進するために、モデル調整プロセスで使用される合成データ生成パイプラインもオープンソース化しています。

要約(オリジナル)

We release the Nemotron-4 340B model family, including Nemotron-4-340B-Base, Nemotron-4-340B-Instruct, and Nemotron-4-340B-Reward. Our models are open access under the NVIDIA Open Model License Agreement, a permissive model license that allows distribution, modification, and use of the models and its outputs. These models perform competitively to open access models on a wide range of evaluation benchmarks, and were sized to fit on a single DGX H100 with 8 GPUs when deployed in FP8 precision. We believe that the community can benefit from these models in various research studies and commercial applications, especially for generating synthetic data to train smaller language models. Notably, over 98% of data used in our model alignment process is synthetically generated, showcasing the effectiveness of these models in generating synthetic data. To further support open research and facilitate model development, we are also open-sourcing the synthetic data generation pipeline used in our model alignment process.

arxiv情報

著者 Nvidia,:,Bo Adler,Niket Agarwal,Ashwath Aithal,Dong H. Anh,Pallab Bhattacharya,Annika Brundyn,Jared Casper,Bryan Catanzaro,Sharon Clay,Jonathan Cohen,Sirshak Das,Ayush Dattagupta,Olivier Delalleau,Leon Derczynski,Yi Dong,Daniel Egert,Ellie Evans,Aleksander Ficek,Denys Fridman,Shaona Ghosh,Boris Ginsburg,Igor Gitman,Tomasz Grzegorzek,Robert Hero,Jining Huang,Vibhu Jawa,Joseph Jennings,Aastha Jhunjhunwala,John Kamalu,Sadaf Khan,Oleksii Kuchaiev,Patrick LeGresley,Hui Li,Jiwei Liu,Zihan Liu,Eileen Long,Ameya Sunil Mahabaleshwarkar,Somshubra Majumdar,James Maki,Miguel Martinez,Maer Rodrigues de Melo,Ivan Moshkov,Deepak Narayanan,Sean Narenthiran,Jesus Navarro,Phong Nguyen,Osvald Nitski,Vahid Noroozi,Guruprasad Nutheti,Christopher Parisien,Jupinder Parmar,Mostofa Patwary,Krzysztof Pawelec,Wei Ping,Shrimai Prabhumoye,Rajarshi Roy,Trisha Saar,Vasanth Rao Naik Sabavat,Sanjeev Satheesh,Jane Polak Scowcroft,Jason Sewall,Pavel Shamis,Gerald Shen,Mohammad Shoeybi,Dave Sizer,Misha Smelyanskiy,Felipe Soares,Makesh Narsimhan Sreedhar,Dan Su,Sandeep Subramanian,Shengyang Sun,Shubham Toshniwal,Hao Wang,Zhilin Wang,Jiaxuan You,Jiaqi Zeng,Jimmy Zhang,Jing Zhang,Vivienne Zhang,Yian Zhang,Chen Zhu
発行日 2024-06-17 16:25:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク