SikuGPT: A Generative Pre-trained Model for Intelligent Information Processing of Ancient Texts from the Perspective of Digital Humanities

要約

【タイトル】SikuGPT:デジタルヒューマニティーズの観点から古典文献の知的情報処理における生成的事前学習モデル

【要約】
– 人工知能技術の急速な進歩により、デジタルヒューマニティーズ研究が繁栄している。これに伴い、古典文献の知的処理、すなわちデジタルヒューマニティーズ研究の重要な構成要素においても、新しい開発トレンドに順応するための研究方法の変革が必要となっている。
– この研究では、『四庫全書』のコーパスに基づくSikuGPTと呼ばれるGPTモデルを提案する。SikuGPTは、古典文献の処理を目的とした他のGPTタイプのモデルよりも、内部翻訳やテキスト分類などのタスクにおいて優れたパフォーマンスを発揮する。
– SikuGPTの能力により、中国の古代文化の国際的な普及に貢献するだけでなく、古代情報や知識サービスの整理にも役立つ。

要約(オリジナル)

The rapid advance in artificial intelligence technology has facilitated the prosperity of digital humanities research. Against such backdrop, research methods need to be transformed in the intelligent processing of ancient texts, which is a crucial component of digital humanities research, so as to adapt to new development trends in the wave of AIGC. In this study, we propose a GPT model called SikuGPT based on the corpus of Siku Quanshu. The model’s performance in tasks such as intralingual translation and text classification exceeds that of other GPT-type models aimed at processing ancient texts. SikuGPT’s ability to process traditional Chinese ancient texts can help promote the organization of ancient information and knowledge services, as well as the international dissemination of Chinese ancient culture.

arxiv情報

著者 Liu Chang,Wang Dongbo,Zhao Zhixiao,Hu Die,Wu Mengcheng,Lin Litao,Shen Si,Li Bin,Liu Jiangfeng,Zhang Hai,Zhao Lianzheng
発行日 2023-04-16 13:25:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク