A Material Lens on Coloniality in NLP

要約

植民地主義、つまり「公式」植民地化を超えた植民地被害の継続は、社会と科学分野全体に広範な影響を及ぼします。
自然言語処理 (NLP) も、この広範な現象の例外ではありません。
この研究では、植民地性が NLP データ、アルゴリズム、ソフトウェアに暗黙のうちに埋め込まれ、それらによって増幅されると主張します。
私たちは、人間の利害関係者とテクノロジーの間の関係のネットワークを通じて社会現象を理解するアプローチであるアクター ネットワーク理論 (ANT) を使用してこの分析を形式化します。
私たちは、アクターネットワークを使用して、NLP 研究のさまざまな段階の地理の定量的調査をガイドし、NLP がそれ自体を構築するにつれて植民地境界に沿った不平等が増大するという証拠を提供します。
これに基づいて、NLP で植民地主義と闘うには、現在の価値観を変えるだけでなく、基礎的なデータとアルゴリズムに蓄積された植民地主義の理想を除去するための積極的な取り組みも必要であると主張します。

要約(オリジナル)

Coloniality, the continuation of colonial harms beyond ‘official’ colonization, has pervasive effects across society and scientific fields. Natural Language Processing (NLP) is no exception to this broad phenomenon. In this work, we argue that coloniality is implicitly embedded in and amplified by NLP data, algorithms, and software. We formalize this analysis using Actor-Network Theory (ANT): an approach to understanding social phenomena through the network of relationships between human stakeholders and technology. We use our Actor-Network to guide a quantitative survey of the geography of different phases of NLP research, providing evidence that inequality along colonial boundaries increases as NLP builds on itself. Based on this, we argue that combating coloniality in NLP requires not only changing current values but also active work to remove the accumulation of colonial ideals in our foundational data and algorithms.

arxiv情報

著者 William Held,Camille Harris,Michael Best,Diyi Yang
発行日 2023-11-14 18:52:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク