MetaEnhance: Metadata Quality Improvement for Electronic Theses and Dissertations of University Libraries

要約

タイトル:大学図書館の学位論文のメタデータの品質向上のためのMetaEnhance

要約:
– デジタルライブラリインターフェースを通じて探すために、メタデータの品質はデジタルオブジェクトで非常に重要である。
– しかしながら、デジタルオブジェクトのメタデータは、様々な理由により、しばしば値が不完全で、整合性がなく、また誤った値を示す。
– 我々は、学術的なメタデータを自動的に検出、修正、および標準化する方法を調査し、電子学位論文(ETD)の7つの主要なフィールドを事例として使用しています。
– 我々は、MetaEnhanceというフレームワークを提案しており、最新の人工知能方法を使用してこれらのフィールドの品質を向上させます。
– MetaEnhanceを評価するために、複数の基準を使用してサンプリングされたサブセットを組み合わせて500のETDを含むメタデータ品質評価ベンチマークを編成しました。
– このベンチマークにMetaEnhanceをテストしたところ、提案された方法がエラーの検出においてほぼ完璧なF1スコアを達成し、5つの7つのフィールドにおいて0.85から1.00までのF1スコアでエラーを修正することができたことがわかりました。

要約(オリジナル)

Metadata quality is crucial for digital objects to be discovered through digital library interfaces. However, due to various reasons, the metadata of digital objects often exhibits incomplete, inconsistent, and incorrect values. We investigate methods to automatically detect, correct, and canonicalize scholarly metadata, using seven key fields of electronic theses and dissertations (ETDs) as a case study. We propose MetaEnhance, a framework that utilizes state-of-the-art artificial intelligence methods to improve the quality of these fields. To evaluate MetaEnhance, we compiled a metadata quality evaluation benchmark containing 500 ETDs, by combining subsets sampled using multiple criteria. We tested MetaEnhance on this benchmark and found that the proposed methods achieved nearly perfect F1-scores in detecting errors and F1-scores in correcting errors ranging from 0.85 to 1.00 for five of seven fields.

arxiv情報

著者 Muntabir Hasan Choudhury,Lamia Salsabil,Himarsha R. Jayanetti,Jian Wu,William A. Ingram,Edward A. Fox
発行日 2023-03-30 18:56:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.DL, cs.LG パーマリンク