要約
子どもは大人に比べて文章を理解する能力が劣ります。
さらに、この能力は子供たちの年齢によって異なります。
したがって、テキストまたは文章に基づいて推奨年齢を自動的に予測することは、子供たちに適切なテキストを提案し、著者が最も適切な方法で執筆するのを支援する上で大きな利点となるでしょう。
この論文では、年齢推奨タスクに関する最近の進歩について説明します。
私たちは年齢の推奨を回帰タスクとして考慮し、適切な評価指標の必要性について議論し、最先端の機械学習モデル、つまり Transformers の使用を研究し、それを文献にあるさまざまなモデルと比較します。
私たちの結果は専門家による推奨事項とも比較されます。
さらに、本論文は、さまざまな言語的特徴を分析することによって、年齢予測モデルの予備的な説明可能性を扱います。
実験は、3,673 のフランス語テキスト (132,000 文、250 万単語) のデータセットに対して行われます。
テキストレベルとセンテンスレベルで年齢を推奨するために、当社の最良のモデルはテストセットでそれぞれ 0.98 と 1.83 の MAE スコアを達成しました。
また、専門家による推奨と比較すると、文章レベルの推奨モデルは専門家と同等のスコアを獲得していますが、テキストレベルの推奨モデルは MAE スコア 1.48 で専門家を上回っています。
要約(オリジナル)
Children have less text understanding capability than adults. Moreover, this capability differs among the children of different ages. Hence, automatically predicting a recommended age based on texts or sentences would be a great benefit to propose adequate texts to children and to help authors writing in the most appropriate way. This paper presents our recent advances on the age recommendation task. We consider age recommendation as a regression task, and discuss the need for appropriate evaluation metrics, study the use of state-of-the-art machine learning model, namely Transformers, and compare it to different models coming from the literature. Our results are also compared with recommendations made by experts. Further, this paper deals with preliminary explainability of the age prediction model by analyzing various linguistic features. We conduct the experiments on a dataset of 3, 673 French texts (132K sentences, 2.5M words). To recommend age at the text level and sentence level, our best models achieve MAE scores of 0.98 and 1.83 respectively on the test set. Also, compared to the recommendations made by experts, our sentence-level recommendation model gets a similar score to the experts, while the text-level recommendation model outperforms the experts by an MAE score of 1.48.
arxiv情報
著者 | Rashedur Rahman,Gwénolé Lecorvé,Nicolas Béchet |
発行日 | 2023-08-21 09:40:19+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google