MN-DS: A Multilabeled News Dataset for News Articles Hierarchical Classification

要約

【タイトル】
ニュース記事の階層分類に向けたマルチラベルのニュース・データセット、MN-DS

【要約】
・2019年1月1日から12月31日までに収集した、17個の第1レベルカテゴリと109個の第2レベルカテゴリを持つ、10,917のニュース記事のデータセットが提示された。
・ニュースカテゴリの分類を基にデータを手動でラベル付けし、このデータセットは機械学習モデルのトレーニングに使用可能であり、ニュース記事の自動分類を行うのに役立つ。
・未来のイベント予測や、ニュースの構造化や分類に取り組んでいる研究者にとっても有用なデータセットである。

要約(オリジナル)

This article presents a dataset of 10,917 news articles with hierarchical news categories collected between 1 January 2019 and 31 December 2019. We manually labeled the articles based on a hierarchical taxonomy with 17 first-level and 109 second-level categories. This dataset can be used to train machine learning models for automatically classifying news articles by topic. This dataset can be helpful for researchers working on news structuring, classification, and predicting future events based on released news.

arxiv情報

著者 Alina Petukhova,Nuno Fachada
発行日 2023-04-23 14:49:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク