Learning Large Margin Sparse Embeddings for Open Set Medical Diagnosis

要約

ディープラーニングを活用したコンピューター支援診断は、大きな進歩を遂げています。
ただし、制御されたラボ環境の外では、アルゴリズムは複数の課題に直面する可能性があります。
オープンセット認識 (OSR) は重要なものとして、トレーニングでは見られなかったカテゴリーがテストで現れる可能性があると述べています。
医療分野では、不完全に収集されたトレーニング データセットや、絶えず出現する新しい病気や希少な病気に由来する可能性があります。
OSR には、既知のクラスを正しく分類するだけでなく、未知のクラスを認識し、さらなる診断のために専門家に転送するアルゴリズムが必要です。
OSR に取り組むために、既知のクラスが埋め込み空間の小さな部分を密に占有し、残りの疎な領域が未知のクラスとして認識される可能性があると仮定します。
これに続いて、2 つのメカニズムを統合するオープンマージンコサイン損失 (OMCL) を提案します。
前者は適応スケール付きマージン損失 (MLAS) と呼ばれ、汎化能力を強化するための適応スケーリング係数とともに、クラス内のコンパクト性とクラス間の分離性を強化する角度マージンを導入します。
後者はオープンスペース抑制 (OSS) と呼ばれ、提案された特徴空間記述子を使用してスパースの埋め込み空間を未知数として認識することで分類器を開きます。
さらに、医療 OSR はまだ初期の分野であるため、比較のために 2 つの公的に利用可能なベンチマーク データセットが提案されています。
広範なアブレーション研究と特徴の視覚化により、各設計の有効性が実証されています。
最先端の方法と比較して、MLAS は、ACC、AUROC、および OSCR によって測定される優れたパフォーマンスを達成します。

要約(オリジナル)

Fueled by deep learning, computer-aided diagnosis achieves huge advances. However, out of controlled lab environments, algorithms could face multiple challenges. Open set recognition (OSR), as an important one, states that categories unseen in training could appear in testing. In medical fields, it could derive from incompletely collected training datasets and the constantly emerging new or rare diseases. OSR requires an algorithm to not only correctly classify known classes, but also recognize unknown classes and forward them to experts for further diagnosis. To tackle OSR, we assume that known classes could densely occupy small parts of the embedding space and the remaining sparse regions could be recognized as unknowns. Following it, we propose Open Margin Cosine Loss (OMCL) unifying two mechanisms. The former, called Margin Loss with Adaptive Scale (MLAS), introduces angular margin for reinforcing intra-class compactness and inter-class separability, together with an adaptive scaling factor to strengthen the generalization capacity. The latter, called Open-Space Suppression (OSS), opens the classifier by recognizing sparse embedding space as unknowns using proposed feature space descriptors. Besides, since medical OSR is still a nascent field, two publicly available benchmark datasets are proposed for comparison. Extensive ablation studies and feature visualization demonstrate the effectiveness of each design. Compared with state-of-the-art methods, MLAS achieves superior performances, measured by ACC, AUROC, and OSCR.

arxiv情報

著者 Mingyuan Liu,Lu Xu,Jicong Zhang
発行日 2023-07-21 05:08:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク