要約
OpenThaiGPT 1.5 は、Qwen v2.5 をベースとした高度なタイ語チャット モデルで、2,000,000 を超えるタイ語命令ペアに基づいて微調整されています。
このレポートは、モデルの開発、機能、パフォーマンスに関するエンジニアリングの観点を提供します。
モデルのアーキテクチャ、トレーニング プロセス、およびマルチターン会話サポート、取得拡張生成 (RAG) 互換性、ツール呼び出し機能などの主要な機能について説明します。
ベンチマーク結果は、さまざまなタイ語タスクにおける OpenThaiGPT 1.5 の最先端のパフォーマンスを示し、他のオープンソースのタイ語モデルを上回っています。
また、GPU メモリ要件や展開戦略などの実際的な考慮事項についても説明します。
要約(オリジナル)
OpenThaiGPT 1.5 is an advanced Thai language chat model based on Qwen v2.5, finetuned on over 2,000,000 Thai instruction pairs. This report provides an engineering perspective on the model’s development, capabilities, and performance. We discuss the model’s architecture, training process, and key features, including multi-turn conversation support, Retrieval Augmented Generation (RAG) compatibility, and tool-calling functionality. Benchmark results demonstrate OpenThaiGPT 1.5’s state-of-the-art performance on various Thai language tasks, outperforming other open-source Thai language models. We also address practical considerations such as GPU memory requirements and deployment strategies.
arxiv情報
著者 | Sumeth Yuenyong,Kobkrit Viriyayudhakorn,Apivadee Piyatumrong,Jillaphat Jaroenkantasima |
発行日 | 2024-11-11 18:58:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google