Gendered Words and Grant Rates: A Textual Analysis of Disparate Outcomes in the Patent System

要約

テキストは、書き手の言語スタイルとコミュニケーション パターンを反映する情報を伝える手段です。
これらの属性を研究することで、著者とその根底にあるメッセージについての潜在的な洞察を発見できます。
この記事では、特許出願とその発明者をより深く理解するために、このようなアプローチを使用します。
これまでの研究は特許メタデータに焦点を当てていましたが、私たちは機械学習と自然言語処理を利用して特許出願の単語から隠された情報を抽出しました。
これらの方法を通じて、発明者の名前がわからなくても、テキストの属性から発明者の性別を特定できることが多いことがわかりました。
テキストを通じて性別を識別できるこの能力は、特許付与率の格差を緩和する解決策として提案されることが多い匿名特許審査が、特許を確保する際の性別による結果に完全には対応していない可能性があることを示唆しています。
私たちの研究では、特許出願の客観的特徴によって特許が付与されるかどうかを予測できるかどうかも調査しています。
分類子アルゴリズムを使用して、特許が付与されるかどうかを 60% 以上の確率で正確に予測しました。
さらなる分析により、語彙や文章の複雑さなどの書き方が、発明者の性別や主題のキーワードなどの他の属性と比べて、助成金の予測に不釣り合いな影響を与えていることが強調されました。
最後に、女性が拒絶率の高い技術分野で不均衡に発明を行っているかどうかを調べます。
クラスタリング アルゴリズムを使用して、アプリケーションは関連する主題を持つグループに割り当てられました。
男性優位のグループでは拒絶率がわずか 45% であるのに対し、女性優位のクラスターの 85% では拒絶率が異常に高いことがわかりました。
これらの調査結果は、テキストの選択、性別、特許取得の成功の間の複雑な相互作用を浮き彫りにしています。
彼らはまた、現在の提案が特許制度における男女平等と効率性を達成するのに十分であるかどうかについても疑問を投げかけている。

要約(オリジナル)

Text is a vehicle to convey information that reflects the writer’s linguistic style and communicative patterns. By studying these attributes, we can discover latent insights about the author and their underlying message. This article uses such an approach to better understand patent applications and their inventors. While prior research focuses on patent metadata, we employ machine learning and natural language processing to extract hidden information from the words in patent applications. Through these methods, we find that inventor gender can often be identified from textual attributes – even without knowing the inventor’s name. This ability to discern gender through text suggests that anonymized patent examination – often proposed as a solution to mitigate disparities in patent grant rates – may not fully address gendered outcomes in securing a patent. Our study also investigates whether objective features of a patent application can predict if it will be granted. Using a classifier algorithm, we correctly predicted whether a patent was granted over 60% of the time. Further analysis emphasized that writing style – like vocabulary and sentence complexity – disproportionately influenced grant predictions relative to other attributes such as inventor gender and subject matter keywords. Lastly, we examine whether women disproportionately invent in technological areas with higher rejection rates. Using a clustering algorithm, applications were allocated into groups with related subject matter. We found that 85% of female-dominated clusters have abnormally high rejection rates, compared to only 45% for male-dominated groupings. These findings highlight complex interactions between textual choices, gender, and success in securing a patent. They also raise questions about whether current proposals will be sufficient to achieve gender equity and efficiency in the patent system.

arxiv情報

著者 Deborah Gerhardt,Miriam Marcowitz-Bitton,W. Michael Schuster,Avshalom Elmalech,Omri Suissa,Moshe Mash
発行日 2024-12-18 17:24:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CY パーマリンク