CliniDigest: A Case Study in Large Language Model Based Large-Scale Summarization of Clinical Trial Descriptions


2022 年には、毎日平均 100 件を超える臨床試験が に提出され、各試験の平均は約 1500 ワードでした [1]。
この問題を軽減するために、GPT-3.5 を使用して CliniDigest と呼ばれるバッチ臨床試験サマライザーを作成しました。
私たちの知る限り、CliniDigest は臨床試験の真実かつ包括的な概要をリアルタイムで提供できる最初のツールです。
CliniDigest は、最大 85 件の臨床試験の説明 (約 10,500 語) を、参考文献と限定的な幻覚を含む簡潔な 200 語の要約に減らすことができます。
私たちは、27 の医療サブドメインに分かれた 457 件の試験を要約する能力について、CliniDigest をテストしました。
CliniDigest はフィールドごとに $\mu=153,\ \sigma=69 $ 単語の要約を生成します。各単語はソースの $\mu=54\%,\ \sigma=30\% $ を利用します。


A clinical trial is a study that evaluates new biomedical interventions. To design new trials, researchers draw inspiration from those current and completed. In 2022, there were on average more than 100 clinical trials submitted to every day, with each trial having a mean of approximately 1500 words [1]. This makes it nearly impossible to keep up to date. To mitigate this issue, we have created a batch clinical trial summarizer called CliniDigest using GPT-3.5. CliniDigest is, to our knowledge, the first tool able to provide real-time, truthful, and comprehensive summaries of clinical trials. CliniDigest can reduce up to 85 clinical trial descriptions (approximately 10,500 words) into a concise 200-word summary with references and limited hallucinations. We have tested CliniDigest on its ability to summarize 457 trials divided across 27 medical subdomains. For each field, CliniDigest generates summaries of $\mu=153,\ \sigma=69 $ words, each of which utilizes $\mu=54\%,\ \sigma=30\% $ of the sources. A more comprehensive evaluation is planned and outlined in this paper.


著者 Renee D. White,Tristan Peng,Pann Sripitak,Alexander Rosenberg Johansen,Michael Snyder,Stanford University
発行日 2023-07-26 21:49:14+00:00
