Kuaiji: the First Chinese Accounting Large Language Model

要約

ChatGPT や GPT-4 などの大規模言語モデル (LLM) は、自然言語の理解と生成において優れた能力を示しています。
ただし、会計などの特殊な領域に適応するという任務を負った場合、困難に直面します。
この課題に対処するために、カスタマイズされた会計大規模言語モデルである Kuaiji を紹介します。
Kuaiji は、継続的な事前トレーニングと監視付き微調整プロセスを含む Baichuan フレームワークを使用して細心の注意を払って微調整されています。
大規模な本物の会計士とクライアントの対話を含むデータセットである CAtAcctQA によってサポートされている Kuaiji は、優れた精度と応答速度を示します。
私たちの貢献には、初の中国会計データセットの作成、主要なオープンソース中国会計 LLM としての Kuaiji の確立、そして実際の会計シナリオを通じたその有効性の検証が含まれます。

要約(オリジナル)

Large Language Models (LLMs) like ChatGPT and GPT-4 have demonstrated impressive proficiency in comprehending and generating natural language. However, they encounter difficulties when tasked with adapting to specialized domains such as accounting. To address this challenge, we introduce Kuaiji, a tailored Accounting Large Language Model. Kuaiji is meticulously fine-tuned using the Baichuan framework, which encompasses continuous pre-training and supervised fine-tuning processes. Supported by CAtAcctQA, a dataset containing large genuine accountant-client dialogues, Kuaiji exhibits exceptional accuracy and response speed. Our contributions encompass the creation of the first Chinese accounting dataset, the establishment of Kuaiji as a leading open-source Chinese accounting LLM, and the validation of its efficacy through real-world accounting scenarios.

arxiv情報

著者 Jiayuan Luo,Songhua Yang,Xiaoling Qiu,Panyu Chen,Yufei Nai,Wenxuan Zeng,Wentao Zhang,Xinke Jiang
発行日 2024-02-21 15:14:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク