The Elephant in the Room: Analyzing the Presence of Big Tech in Natural Language Processing Research

要約

自然言語処理 (NLP) のためのディープラーニング手法の最近の進歩により、新たなビジネスチャンスが生まれ、NLP 研究が業界の発展にとって重要なものとなっています。
NLP 分野の大手企業の 1 つとして、政府や大学と協力して、研究に対する産業界の影響を追跡することが重要です。
この研究では、NLP コミュニティにおける業界の存在感を長期にわたって定量化し、特徴づけることを目指しています。
78,187 冊の NLP 出版物と 701 件の NLP 出版物の著者の履歴書の包括的なメタデータを含むコーパスを使用して、90 年代初頭以来のこの分野における業界の存在感を調査します。
NLP 著者の業界での存在感は、過去 5 年間で急激に増加するまでは安定していました (2017 年から 2022 年までに 180% の成長)。
出版物のほとんどを数社が占めており、助成金やインターンシップを通じて学術研究者に資金を提供しています。
私たちの研究は、自然言語処理研究に対する業界の存在と影響が大きく、急速に成長していることを示しています。
この取り組みでは、この分野における業界の影響力の透明性を高めることが求められています。

要約(オリジナル)

Recent advances in deep learning methods for natural language processing (NLP) have created new business opportunities and made NLP research critical for industry development. As one of the big players in the field of NLP, together with governments and universities, it is important to track the influence of industry on research. In this study, we seek to quantify and characterize industry presence in the NLP community over time. Using a corpus with comprehensive metadata of 78,187 NLP publications and 701 resumes of NLP publication authors, we explore the industry presence in the field since the early 90s. We find that industry presence among NLP authors has been steady before a steep increase over the past five years (180% growth from 2017 to 2022). A few companies account for most of the publications and provide funding to academic researchers through grants and internships. Our study shows that the presence and impact of the industry on natural language processing research are significant and fast-growing. This work calls for increased transparency of industry influence in the field.

arxiv情報

著者 Mohamed Abdalla,Jan Philip Wahle,Terry Ruas,Aurélie Névéol,Fanny Ducel,Saif M. Mohammad,Karën Fort
発行日 2024-07-01 12:30:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク