要約
全体的な自動エッセイスコアリング(AES)に関する研究は長期に及んでいます。
しかし、個々の特性に従ってエッセイを評価するための注目の顕著な注意があります。
この作業では、一般的でありながら根本的な特性に固有の新しい特性固有のルーブリックベースのクロスプロムプトAESフレームワークであるTratesを提案します。
フレームワークは、特性グレーディングルーブリックを利用して特性固有の機能(評価の質問で表される)を生成する大きな言語モデル(LLM)を活用し、エッセイを与えられた機能を評価します。
特性固有の機能は、最終的には一般的なライティング品質およびプロンプト固有の機能と組み合わされ、目に見えないプロンプトからのエッセイの特性スコアを予測する単純な古典的回帰モデルをトレーニングします。
実験は、Tratesが広く使用されているデータセット上のすべての特性にわたって新しい最先端のパフォーマンスを達成し、生成されたLLMベースの機能が最も重要であることを示しています。
要約(オリジナル)
Research on holistic Automated Essay Scoring (AES) is long-dated; yet, there is a notable lack of attention for assessing essays according to individual traits. In this work, we propose TRATES, a novel trait-specific and rubric-based cross-prompt AES framework that is generic yet specific to the underlying trait. The framework leverages a Large Language Model (LLM) that utilizes the trait grading rubrics to generate trait-specific features (represented by assessment questions), then assesses those features given an essay. The trait-specific features are eventually combined with generic writing-quality and prompt-specific features to train a simple classical regression model that predicts trait scores of essays from an unseen prompt. Experiments show that TRATES achieves a new state-of-the-art performance across all traits on a widely-used dataset, with the generated LLM-based features being the most significant.
arxiv情報
著者 | Sohaila Eltanbouly,Salam Albatarni,Tamer Elsayed |
発行日 | 2025-05-20 16:34:37+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google