要約
薬物有害事象 (ADE) などの意味のある薬物関連情報を抽出することは、罹患を防止し、多くの命を救うために非常に重要です。
ほとんどの ADE は、医療コンテキストとの非構造化会話を通じて報告されるため、一般的なエンティティ認識アプローチを適用するだけでは十分ではありません。
この論文では、薬物関連文書からさまざまなコンテキスト/言語/知識のプロパティを取得して調整することにより、薬物実体/イベントを検出するための新しいマルチアスペクトクロス統合フレームワークを提案します。
まず、スロットタグ付けタスク、主な薬物実体/イベント検出、品詞タグ付け、および一般的な医療固有表現認識を実行することにより、意味論的、構文論的、および医療文書のコンテキスト情報を記述するマルチアスペクトエンコーダを構築します。
次に、各エンコーダーは、キーバリュー クロス、アテンション クロス、フィードフォワード クロスの 3 つの方法で他のコンテキスト情報との相互統合を実行するため、マルチ エンコーダーは深く統合されます。
私たちのモデルは、フラット エンティティ検出と不連続イベント抽出という 2 つの広く使用されているタスクにおいて、すべての SOTA よりも優れたパフォーマンスを発揮します。
要約(オリジナル)
Extracting meaningful drug-related information chunks, such as adverse drug events (ADE), is crucial for preventing morbidity and saving many lives. Most ADEs are reported via an unstructured conversation with the medical context, so applying a general entity recognition approach is not sufficient enough. In this paper, we propose a new multi-aspect cross-integration framework for drug entity/event detection by capturing and aligning different context/language/knowledge properties from drug-related documents. We first construct multi-aspect encoders to describe semantic, syntactic, and medical document contextual information by conducting those slot tagging tasks, main drug entity/event detection, part-of-speech tagging, and general medical named entity recognition. Then, each encoder conducts cross-integration with other contextual information in three ways: the key-value cross, attention cross, and feedforward cross, so the multi-encoders are integrated in depth. Our model outperforms all SOTA on two widely used tasks, flat entity detection and discontinuous event extraction.
arxiv情報
著者 | Jie Yang,Soyeon Caren Han,Siqu Long,Josiah Poon,Goran Nenadic |
発行日 | 2023-08-15 07:28:15+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google