要約
このペーパーでは、ラベル付けの一貫性を評価するために伝統的に使用されてきたアノテーター間協定 (IAA) を活用して、データ管理オペレーション (DMOps) を最適化する新しいアプローチを紹介します。
私たちは、個々のアノテーターのラベル付けの品質を予測する際に IAA を使用し、データ作成のコストと時間の効率を高めることを提唱しています。
さらに、私たちの研究は、文書の難易度を予測する IAA の可能性を浮き彫りにし、それによってデータ構築プロセスの全体的な効率を向上させます。
この研究は、データ駆動型研究の最適化における IAA の幅広い応用可能性を強調し、効率、コスト削減、高品質データを優先する大規模データ プロジェクトに重要な意味を持ちます。
要約(オリジナル)
This paper presents a novel approach of leveraging Inter-Annotator Agreement (IAA), traditionally used for assessing labeling consistency, to optimize Data Management Operations (DMOps). We advocate for the use of IAA in predicting the labeling quality of individual annotators, leading to cost and time efficiency in data production. Additionally, our work highlights the potential of IAA in forecasting document difficulty, thereby boosting the data construction process’s overall efficiency. This research underscores IAA’s broader application potential in data-driven research optimization and holds significant implications for large-scale data projects prioritizing efficiency, cost reduction, and high-quality data.
arxiv情報
著者 | Damrin Kim,NamHyeok Kim,Chanjun Park,Harksoo Kim |
発行日 | 2023-06-26 01:33:58+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google