Overview of the EHRSQL 2024 Shared Task on Reliable Text-to-SQL Modeling on Electronic Health Records

要約

電子医療記録 (EHR) は、病院内の患者の病歴全体を保存するリレーショナル データベースです。
これらは、入院、診断から治療、退院に至るまで、患者の医療ケアのさまざまな側面を記録します。
EHR は臨床データの重要なソースですが、事前定義された一連のクエリを超えて EHR を探索するには、SQL などのクエリ言語のスキルが必要です。
情報検索をよりアクセスしやすくするための 1 つの戦略は、自然言語の質問を対応する SQL クエリに自動的に変換し、これらのクエリを使用して回答を取得できる text-to-SQL モデルを活用して、質問応答システムを構築することです。
EHRSQL 2024 共有タスクは、テキストから SQL へのモデリングを使用した EHR 用の質問応答システムの開発における研究を推進し、促進することを目的としています。このシステムは、さまざまな医療専門家に要求された回答を確実に提供して、臨床作業プロセスを改善し、ニーズを満たすことができます。
共有タスクに応募した 100 名を超える参加者の中から 8 つのチームが結成され、共有タスクの要件全体を完了し、このタスクを効果的に解決するための幅広い方法を実証しました。
このペーパーでは、信頼性の高いテキストから SQL へのモデリングのタスク、データセット、参加者による手法と結果について説明します。
この共通の課題により、EHR 向けの信頼できる質問応答システムの開発に関するさらなる研究と洞察が促進されることを期待しています。

要約(オリジナル)

Electronic Health Records (EHRs) are relational databases that store the entire medical histories of patients within hospitals. They record numerous aspects of patients’ medical care, from hospital admission and diagnosis to treatment and discharge. While EHRs are vital sources of clinical data, exploring them beyond a predefined set of queries requires skills in query languages like SQL. To make information retrieval more accessible, one strategy is to build a question-answering system, possibly leveraging text-to-SQL models that can automatically translate natural language questions into corresponding SQL queries and use these queries to retrieve the answers. The EHRSQL 2024 shared task aims to advance and promote research in developing a question-answering system for EHRs using text-to-SQL modeling, capable of reliably providing requested answers to various healthcare professionals to improve their clinical work processes and satisfy their needs. Among more than 100 participants who applied to the shared task, eight teams were formed and completed the entire shared task requirement and demonstrated a wide range of methods to effectively solve this task. In this paper, we describe the task of reliable text-to-SQL modeling, the dataset, and the methods and results of the participants. We hope this shared task will spur further research and insights into developing reliable question-answering systems for EHRs.

arxiv情報

著者 Gyubok Lee,Sunjun Kweon,Seongsu Bae,Edward Choi
発行日 2024-05-23 17:25:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク