要約
自然言語処理 (NLP) は世界に大きな影響を与えようとしています。
しかし、大きな進歩には大きなリスクが伴います。
それらに対処するには、さまざまな研究分野との幅広い関与が必要です。
しかし、そのような関与の状態(過去または現在の)を調査した実証的な研究はほとんどありません。
この論文では、23 の研究分野と NLP の間の(相互の)影響の程度を定量化します。
約 77,000 件の NLP 論文、NLP 論文から他の論文への約 310 万件の引用、および他の論文から NLP 論文への約 180 万件の引用を分析しました。
ほとんどの分野とは異なり、私たちが提案する引用分野多様性指数 (CFDI) で測定した NLP の分野間のエンゲージメントは、1980 年の 0.58 から 2022 年の 0.31 (過去最低) まで低下していることを示しています。
さらに、NLP がより閉鎖的になっていることがわかりました。引用される NLP 論文がますます増え、分野間の橋渡しとなる論文が減少しています。
NLP の引用はコンピューター サイエンスが大半を占めています。
NLP の引用のうち言語学に関するものは 8% 未満、数学と心理学に関するものは 3% 未満です。
これらの調査結果は、NLP がさまざまな分野との関わりを早急に検討する必要があることを強調しています。
要約(オリジナル)
Natural Language Processing (NLP) is poised to substantially influence the world. However, significant progress comes hand-in-hand with substantial risks. Addressing them requires broad engagement with various fields of study. Yet, little empirical work examines the state of such engagement (past or current). In this paper, we quantify the degree of influence between 23 fields of study and NLP (on each other). We analyzed ~77k NLP papers, ~3.1m citations from NLP papers to other papers, and ~1.8m citations from other papers to NLP papers. We show that, unlike most fields, the cross-field engagement of NLP, measured by our proposed Citation Field Diversity Index (CFDI), has declined from 0.58 in 1980 to 0.31 in 2022 (an all-time low). In addition, we find that NLP has grown more insular — citing increasingly more NLP papers and having fewer papers that act as bridges between fields. NLP citations are dominated by computer science; Less than 8% of NLP citations are to linguistics, and less than 3% are to math and psychology. These findings underscore NLP’s urgent need to reflect on its engagement with various fields.
arxiv情報
著者 | Jan Philip Wahle,Terry Ruas,Mohamed Abdalla,Bela Gipp,Saif M. Mohammad |
発行日 | 2024-07-16 08:50:11+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google