Efficient extraction of medication information from clinical notes: an evaluation in two languages

要約

目的:臨床物語から投薬情報を抽出するための新しい自然言語処理(NLP)方法の精度、計算コスト、および移植性を評価する。
材料と方法:エンティティの抽出と患者の薬物療法に関する関係のためのオリジナルの変圧器ベースのアーキテクチャを提案します。
最初に、このアプローチを使用して、フランスの臨床ノートのモデルを訓練および評価し、h \^opitaux Universitaires de strasbourgの新しく注釈付きコーパスを使用しました。
第二に、アプローチの携帯性は、2018 N2C2共有タスクから英語の臨床文書に関する評価を実施することにより評価されました。
情報抽出の精度と計算コストは​​、変圧器を使用した利用可能な方法と比較して評価されました。
結果:提案されたアーキテクチャは、フランス語と英語の両方で最先端の競争力のある関係性抽出自体のパフォーマンスのタスクで達成されます(F測定0.82および0.96対0.81および0.95)が、計算コストを削減します。
10。エンドツーエンド(エンティティ認識と関係の抽出と名付けられた)F1パフォーマンスは、フランス語および英語のコーパスで0.69および0.82です。
ディスカッション:英語のノート用に開発された既存のシステムは、合理的な努力を払ってフランスの病院の環境に展開されましたが、代替アーキテクチャは、フランス語と英語の両方の臨床の両方に同等の抽出パフォーマンスと低い計算上の影響を伴うエンドツーエンドの薬物情報抽出を提供することがわかりました。
それぞれテキスト処理。
結論:提案されたアーキテクチャを使用して、高性能および低い計算コストで臨床テキストから投薬情報を抽出することができ、その結果、通常限られた病院のITリソースに合っています

要約(オリジナル)

Objective: To evaluate the accuracy, computational cost and portability of a new Natural Language Processing (NLP) method for extracting medication information from clinical narratives. Materials and Methods: We propose an original transformer-based architecture for the extraction of entities and their relations pertaining to patients’ medication regimen. First, we used this approach to train and evaluate a model on French clinical notes, using a newly annotated corpus from H\^opitaux Universitaires de Strasbourg. Second, the portability of the approach was assessed by conducting an evaluation on clinical documents in English from the 2018 n2c2 shared task. Information extraction accuracy and computational cost were assessed by comparison with an available method using transformers. Results: The proposed architecture achieves on the task of relation extraction itself performance that are competitive with the state-of-the-art on both French and English (F-measures 0.82 and 0.96 vs 0.81 and 0.95), but reduce the computational cost by 10. End-to-end (Named Entity recognition and Relation Extraction) F1 performance is 0.69 and 0.82 for French and English corpus. Discussion: While an existing system developed for English notes was deployed in a French hospital setting with reasonable effort, we found that an alternative architecture offered end-to-end drug information extraction with comparable extraction performance and lower computational impact for both French and English clinical text processing, respectively. Conclusion: The proposed architecture can be used to extract medication information from clinical text with high performance and low computational cost and consequently suits with usually limited hospital IT resources

arxiv情報

著者 Thibaut Fabacher,Erik-André Sauleau,Emmanuelle Arcay,Bineta Faye,Maxime Alter,Archia Chahard,Nathan Miraillet,Adrien Coulet,Aurélie Névéol
発行日 2025-02-05 15:13:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR パーマリンク