A Text-based Approach For Link Prediction on Wikipedia Articles

要約

本論文では、DSAA 2023チャレンジにおけるWikipedia記事のリンク予測に関する我々の研究を紹介する。我々は、2つのノードがリンクを持つかどうかを予測するための分類モデルを訓練するために、テキストから抽出された品詞タグ(part-of-speech tags)の特徴を持つ伝統的な機械学習モデルを使用する。そして、これらのタグを用いて様々な機械学習モデルをテストする。その結果、F1スコアは0.99999となり、7位に入賞しました。ソースコードは https://github.com/Tam1032/DSAA2023-Challenge-Link-prediction-DS-UIT_SAT で公開されている。

要約(オリジナル)

This paper present our work in the DSAA 2023 Challenge about Link Prediction for Wikipedia Articles. We use traditional machine learning models with POS tags (part-of-speech tags) features extracted from text to train the classification model for predicting whether two nodes has the link. Then, we use these tags to test on various machine learning models. We obtained the results by F1 score at 0.99999 and got 7th place in the competition. Our source code is publicly available at this link: https://github.com/Tam1032/DSAA2023-Challenge-Link-prediction-DS-UIT_SAT

arxiv情報

著者 Anh Hoang Tran,Tam Minh Nguyen,Son T. Luu
発行日 2023-09-01 08:00:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI パーマリンク