Predicting Sustainable Development Goals Using Course Descriptions — from LLMs to Conventional Foundation Models

要約

大学のコースにおける国連の持続可能な開発目標(SDG)の予測に関する研究を紹介します。
PaLM 2 という名前の LLM を使用して、人間が作成したノイズの多いコース説明を入力として与えられたトレーニング データを生成します。
私たちはこのデータを使用して、大学のコースの SDG を予測するために、いくつかの異なる小規模な言語モデルをトレーニングします。
この取り組みは、大学レベルでの SDGs のより適切な適応に貢献します。
私たちの実験で最高のパフォーマンスを発揮したモデルは、F1 スコアが 0.786 の BART でした。

要約(オリジナル)

We present our work on predicting United Nations sustainable development goals (SDG) for university courses. We use an LLM named PaLM 2 to generate training data given a noisy human-authored course description input as input. We use this data to train several different smaller language models to predict SDGs for university courses. This work contributes to better university level adaptation of SDGs. The best performing model in our experiments was BART with an F1-score of 0.786.

arxiv情報

著者 Lev Kharlashkin,Melany Macias,Leo Huovinen,Mika Hämäläinen
発行日 2024-02-26 09:19:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク