Data Augmentation Techniques for Chinese Disease Name Normalization

要約

病名の正規化は、医療領域における重要なタスクである。様々なフォーマットで記述された病名を標準化された病名に分類し、様々な疾患関連機能のためのスマートヘルスケアシステムの基本的なコンポーネントとして機能する。にもかかわらず、既存の病名正規化システムの最も大きな障害は、学習データの深刻な不足である。そこで我々は、この問題を軽減するために、一連のデータ増強技術といくつかの支援モジュールを含む、新しいデータ増強アプローチを提示する。広範な実験を通じて、我々の提案するアプローチが、様々なベースラインモデルと訓練目的、特に訓練データが限られたシナリオにおいて、大幅な性能向上を示すことを示す。

要約(オリジナル)

Disease name normalization is an important task in the medical domain. It classifies disease names written in various formats into standardized names, serving as a fundamental component in smart healthcare systems for various disease-related functions. Nevertheless, the most significant obstacle to existing disease name normalization systems is the severe shortage of training data. Consequently, we present a novel data augmentation approach that includes a series of data augmentation techniques and some supporting modules to help mitigate the problem. Through extensive experimentation, we illustrate that our proposed approach exhibits significant performance improvements across various baseline models and training objectives, particularly in scenarios with limited training data

arxiv情報

著者 Wenqian Cui,Xiangling Fu,Shaohui Liu,Mingjun Gu,Xien Liu,Ji Wu,Irwin King
発行日 2025-01-02 11:12:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CL パーマリンク