PhoGPT: Generative Pre-training for Vietnamese

要約

私たちは、ベトナム語用の PhoGPT という名前の最先端の 7.5B パラメーター生成モデル シリーズをオープンソース化しています。これには、ベースの事前トレーニング済み単言語モデル PhoGPT-7B5 と、その命令に従うバリアントである PhoGPT-7B5-Instruct が含まれています。
また、人体評価実験により、これまでのオープンソースモデルと比較して優れた性能を実証しています。
GitHub: https://github.com/VinAIResearch/PhoGPT

要約(オリジナル)

We open-source a state-of-the-art 7.5B-parameter generative model series named PhoGPT for Vietnamese, which includes the base pre-trained monolingual model PhoGPT-7B5 and its instruction-following variant, PhoGPT-7B5-Instruct. In addition, we also demonstrate its superior performance compared to previous open-source models through a human evaluation experiment. GitHub: https://github.com/VinAIResearch/PhoGPT

arxiv情報

著者 Dat Quoc Nguyen,Linh The Nguyen,Chi Tran,Dung Ngoc Nguyen,Nhung Nguyen,Thien Huu Nguyen,Dinh Phung,Hung Bui
発行日 2023-11-06 08:26:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク