Improving Cancer Hallmark Classification with BERT-based Deep Learning Approach

要約

この論文では、がん研究において重要な課題であるがんの特徴を正確に分類するための新しいアプローチを紹介します。
私たちが提案する方法は、さまざまなダウンストリーム アプリケーションで優れたパフォーマンスを示している Bidirectional Encoder Representations from Transformers (BERT) アーキテクチャを利用しています。
転移学習を適用することで、がんに関連する生物医学テキスト文書の小さなコーパスで事前トレーニングされた BERT モデルを微調整しました。
私たちの実験調査の結果は、私たちのアプローチが94.45%という注目に値する精度を達成し、文献で報告されている少なくとも8.04%の大幅な向上により、これまでのほぼすべての発見を上回っていることを示しています。
これらの発見は、癌研究のためのテキスト文書を正確に分類して理解する上で私たちが提案したモデルの有効性を強調しており、この分野に大きく貢献しています。
がんは依然として世界の主な死因のトップ 10 の 1 つであるため、私たちのアプローチはがん研究を推進し、患者の転帰を改善する上で大きな期待を持っています。

要約(オリジナル)

This paper presents a novel approach to accurately classify the hallmarks of cancer, which is a crucial task in cancer research. Our proposed method utilizes the Bidirectional Encoder Representations from Transformers (BERT) architecture, which has shown exceptional performance in various downstream applications. By applying transfer learning, we fine-tuned the pre-trained BERT model on a small corpus of biomedical text documents related to cancer. The outcomes of our experimental investigations demonstrate that our approach attains a noteworthy accuracy of 94.45%, surpassing almost all prior findings with a substantial increase of at least 8.04% as reported in the literature. These findings highlight the effectiveness of our proposed model in accurately classifying and comprehending text documents for cancer research, thus contributing significantly to the field. As cancer remains one of the top ten leading causes of death globally, our approach holds great promise in advancing cancer research and improving patient outcomes.

arxiv情報

著者 Sultan Zavrak,Seyhmus Yilmaz
発行日 2023-06-07 12:23:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, I.2 パーマリンク