Semi-automated extraction of research topics and trends from NCI funding in radiological sciences from 2000-2020

要約

研究者、資金提供者、そして一般の人々は、公的資金による研究のテーマや傾向に関する知識を望んでいますが、手作業で分類する現在の取り組みは規模も理解力も限られています。
私たちは、研究トピックを抽出して名前を付ける半自動アプローチを開発し、これを放射線科学における 21 年間にわたる NCI 資金 19 億円に適用して、ミクロおよびマクロスケールの研究トピックと資金傾向を決定しました。
私たちの手法は、既存の生物医学ベースの単語埋め込みの逐次クラスタリング、主題の専門家を使用した命名、および個々のトピックを超えた巨視的スケールで傾向を発見するための視覚化に依存しています。
15 および 60 のクラスター トピックを使用した結果を示します。助成金の埋め込みの 2D 投影により、物理学 – 生物学と治療 – 診断という 2 つの主要な軸が明らかになることがわかりました。
私たちのデータセットでは、治療学と物理学に基づいた研究への資金提供が、それぞれ診断学と生物学に基づいた研究を上回っていることがわかりました。
私たちは、これらの結果が、(1) 資金配分の適切性について資金提供者に洞察を与えること、(2) 研究者が自分の研究を文脈化して近隣の研究領域を探索することを支援すること、(3) 一般の人々が自分たちの税金がどこに使われているかを見直すことができることを願っています。
割り当てられました。

要約(オリジナル)

Investigators, funders, and the public desire knowledge on topics and trends in publicly funded research but current efforts in manual categorization are limited in scale and understanding. We developed a semi-automated approach to extract and name research topics, and applied this to \$1.9B of NCI funding over 21 years in the radiological sciences to determine micro- and macro-scale research topics and funding trends. Our method relies on sequential clustering of existing biomedical-based word embeddings, naming using subject matter experts, and visualization to discover trends at a macroscopic scale above individual topics. We present results using 15 and 60 cluster topics, where we found that 2D projection of grant embeddings reveals two dominant axes: physics-biology and therapeutic-diagnostic. For our dataset, we found that funding for therapeutics- and physics-based research have outpaced diagnostics- and biology-based research, respectively. We hope these results may (1) give insight to funders on the appropriateness of their funding allocation, (2) assist investigators in contextualizing their work and explore neighboring research domains, and (3) allow the public to review where their tax dollars are being allocated.

arxiv情報

著者 Mark Nguyen,Peter Beidler,Joseph Tsai,August Anderson,Daniel Chen,Paul Kinahan,John Kang
発行日 2023-06-22 17:47:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T10, 68T50, cs.CL, cs.CV, I.2.7 パーマリンク