要約
医療画像の分類は、診断と治療のために重要であり、人工知能の進歩から大きな恩恵を受けています。
このペーパーでは、最近のフィールドの進捗状況をレビューし、基本、具体的、適用される3つのレベルのソリューションに焦点を当てています。
畳み込みニューラルネットワークやビジョン変圧器などの深い学習モデルを使用して、ビジョン言語モデルを使用した最先端のアプローチを使用して、従来の方法の進歩を強調しています。
これらのモデルは、限られたラベル付きデータの問題に取り組み、説明可能な人工知能を通じて予測結果を強化および説明します。
要約(オリジナル)
Medical image classification is crucial for diagnosis and treatment, benefiting significantly from advancements in artificial intelligence. The paper reviews recent progress in the field, focusing on three levels of solutions: basic, specific, and applied. It highlights advances in traditional methods using deep learning models like Convolutional Neural Networks and Vision Transformers, as well as state-of-the-art approaches with Vision Language Models. These models tackle the issue of limited labeled data, and enhance and explain predictive results through Explainable Artificial Intelligence.
arxiv情報
著者 | Loan Dao,Ngoc Quoc Ly |
発行日 | 2025-06-04 16:20:26+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google