要約
このペーパーでは、パレルモ大学で学生/修士号コースを選択するのを支援するために開発された大規模な言語モデルに依存しているチャットボットであるUnipa-GPTのアーキテクチャとトレーニングを示しています。
Unipa-GPTはGPT-3.5-Turboに依存しており、ヨーロッパの研究者の夜(鋭い夜)の文脈で提示されました。
実験では、検索拡張生成(RAG)アプローチとシステムを開発するための微調整の両方を採用しました。
Unipa-GPTのアーキテクチャ全体が提示されています。RAGと微調整されたシステムの両方を比較し、パフォーマンスに関する簡単な議論が報告されています。
他の大規模な言語モデルとのさらなる比較および鋭い夜の実験結果が示されています。
CorporaとコードはGithubで利用できます
要約(オリジナル)
This paper illustrates the architecture and training of Unipa-GPT, a chatbot relying on a Large Language Model, developed for assisting students in choosing a bachelor/master degree course at the University of Palermo. Unipa-GPT relies on gpt-3.5-turbo, it was presented in the context of the European Researchers’ Night (SHARPER night). In our experiments we adopted both the Retrieval Augmented Generation (RAG) approach and fine-tuning to develop the system. The whole architecture of Unipa-GPT is presented, both the RAG and the fine-tuned systems are compared, and a brief discussion on their performance is reported. Further comparison with other Large Language Models and the experimental results during the SHARPER night are illustrated. Corpora and code are available on GitHub
arxiv情報
著者 | Irene Siragusa,Roberto Pirrone |
発行日 | 2025-04-17 14:57:34+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google