Comparative Topic Modeling for Determinants of Divergent Report Results Applied to Macular Degeneration Studies

要約

トピックモデリングとテキストマイニングは、メタアナリシス(MA)とシステマティックレビュー(SR)の実施に関連する自然言語処理のサブセットである。エビデンスの統合のために、上記の自然言語処理手法は、トピックに特化した文献検索や、SRやMAの必須フェーズを自動化するためのレポートからの値の抽出に従来使用されてきた。その代わりに、本研究では、同じ一般的な研究課題に関する矛盾した結果の報告を分析するための比較トピックモデリングアプローチを提案する。具体的には、有意な結果の報告全体における出現率の割合と分布の一貫性に従ってトピックをランク付けすることで、関心のある結果に対する有意な結果と明確な関連を示すトピックを発見することを目的とする。提案された方法は、補助的な栄養化合物が黄斑変性症(MD)に有意に有益かどうかを扱う広範な研究でテストされた。その結果、8つの化合物が、MDに有益であるという有意な結果の報告と特定の関連を有することが同定された。これらのうち6つは、検証のためのフォローアップ文献検索を行ったところ、有効性がさらに支持された(オメガ3脂肪酸、銅、ゼアキサンチン、ルテイン、亜鉛、硝酸塩)。フォローアップの文献検索で支持されなかった2つ(ナイアシンとモリブデン)は、提案された手法のランキングシステムでも最低のスコアであったことから、与えられたトピックに対する提案された手法のスコアは、関心のある結果との関連性の程度を示す有効な代用品であることが示唆された。これらの結果は、提案手法が、広範な報告から影響を理解する際に特異性を付加し、将来の研究のために関心のあるトピックを解明し、体系的かつ拡張可能な方法でエビデンスの統合を導く可能性を裏付けている。

要約(オリジナル)

Topic modeling and text mining are subsets of Natural Language Processing with relevance for conducting meta-analysis (MA) and systematic review (SR). For evidence synthesis, the above NLP methods are conventionally used for topic-specific literature searches or extracting values from reports to automate essential phases of SR and MA. Instead, this work proposes a comparative topic modeling approach to analyze reports of contradictory results on the same general research question. Specifically, the objective is to find topics exhibiting distinct associations with significant results for an outcome of interest by ranking them according to their proportional occurrence and consistency of distribution across reports of significant results. The proposed method was tested on broad-scope studies addressing whether supplemental nutritional compounds significantly benefit macular degeneration (MD). Eight compounds were identified as having a particular association with reports of significant results for benefitting MD. Six of these were further supported in terms of effectiveness upon conducting a follow-up literature search for validation (omega-3 fatty acids, copper, zeaxanthin, lutein, zinc, and nitrates). The two not supported by the follow-up literature search (niacin and molybdenum) also had the lowest scores under the proposed methods ranking system, suggesting that the proposed method’s score for a given topic is a viable proxy for its degree of association with the outcome of interest. These results underpin the proposed methods potential to add specificity in understanding effects from broad-scope reports, elucidate topics of interest for future research, and guide evidence synthesis in a systematic and scalable way.

arxiv情報

著者 Lucas Cassiel Jacaruso
発行日 2023-09-01 07:53:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL パーマリンク