A Test of Time: Predicting the Sustainable Success of Online Collaboration in Wikipedia

要約

インターネットは、グローバルなコラボレーションの可能性を大幅に拡大し、何百万人ものユーザーがウィキペディアのような集合プロジェクトに貢献できるようになりました。
以前の作業ではオンラインコラボレーションの成功を評価していますが、ほとんどのアプローチは時間と依存しており、その寿命を考慮せずに成功を評価しています。
オンラインコラボレーションにおける高品質の基準の長期的な保存を保証する要因に関する研究はほとんどありません。
この研究では、このギャップに対処します。
私たちは、長期にわたって品質を維持するための共同作業の能力を測定する「持続可能な成功」という新しいメトリック、「持続可能な成功」を提案します。
Wikipediaをケーススタディとして使用して、各記事の持続可能な成功ラベルや編集履歴、ユーザーエクスペリエンス、チーム構成などの300を超える説明機能を含む40kを超えるウィキペディアの記事からデータをまとめるSustainpedia Datasetを紹介します。
このデータセットを使用して、機械学習モデルを開発して、ウィキペディア記事の持続可能な成功を予測します。
当社の最高のパフォーマンスモデルは、平均して0.88の高いAU-ROCスコアを達成しています。
私たちの分析は、重要な洞察を明らかにしています。
たとえば、記事が高品質であると認識されるのに時間がかかるほど、時間の経過とともにそのステータスを維持する可能性が高くなる可能性が高いことがわかります(つまり、持続可能です)。
さらに、ユーザーエクスペリエンスは、持続可能性の最も重要な予測因子として浮上しました。
私たちの分析は、ウィキペディアを超えたより広範な集合的な行動(例:オンラインアクティビズム、クラウドソーシングされたオープンソースソフトウェア)に関する洞察を提供します。
この研究に使用されるすべてのデータとコードを、さらなる研究のために公開されています。

要約(オリジナル)

The Internet has significantly expanded the potential for global collaboration, allowing millions of users to contribute to collective projects like Wikipedia. While prior work has assessed the success of online collaborations, most approaches are time-agnostic, evaluating success without considering its longevity. Research on the factors that ensure the long-term preservation of high-quality standards in online collaboration is scarce. In this study, we address this gap. We propose a novel metric, `Sustainable Success,’ which measures the ability of collaborative efforts to maintain their quality over time. Using Wikipedia as a case study, we introduce the SustainPedia dataset, which compiles data from over 40K Wikipedia articles, including each article’s sustainable success label and more than 300 explanatory features such as edit history, user experience, and team composition. Using this dataset, we develop machine learning models to predict the sustainable success of Wikipedia articles. Our best-performing model achieves a high AU-ROC score of 0.88 on average. Our analysis reveals important insights. For example, we find that the longer an article takes to be recognized as high-quality, the more likely it is to maintain that status over time (i.e., be sustainable). Additionally, user experience emerged as the most critical predictor of sustainability. Our analysis provides insights into broader collective actions beyond Wikipedia (e.g., online activism, crowdsourced open-source software), where the same social dynamics that drive success on Wikipedia might play a role. We make all data and code used for this study publicly available for further research.

arxiv情報

著者 Abraham Israeli,David Jurgens,Daniel Romero
発行日 2025-03-14 17:47:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CY, cs.SI パーマリンク