要約
我々は、あらゆる神経生存分析モデルで使用されるあらゆる中間埋込み表現を可視化するための一般的なフレームワークを提案する。我々のフレームワークは、埋め込み空間におけるいわゆるアンカー方向に基づいている。このアンカー方向は、クラスタリングを用いて推定する方法と、生入力の集まりによって定義されるユーザー提供の「概念」(例えば、女性患者からの特徴ベクトルはすべて「女性」という概念をエンコードすることができる)を用いて推定する方法があることを示している。表データについては、アンカー方向が生の臨床的特徴や生存時間分布とどのように関連しているかを明らかにする視覚化戦略を提示する。次に、これらの可視化のアイデアが、画像という生の入力の取り扱いにどのように拡張されるかを示す。我々のフレームワークは、埋め込み空間におけるベクトル間の角度を見ることに基づいており、大きさの情報を無視することで「情報損失」が生じる可能性がある。この損失が、可視化で現れる「塊」のアーチファクトにつながることを示し、実際にこの情報損失を低減する方法を示す。
要約(オリジナル)
We propose a general framework for visualizing any intermediate embedding representation used by any neural survival analysis model. Our framework is based on so-called anchor directions in an embedding space. We show how to estimate these anchor directions using clustering or, alternatively, using user-supplied ‘concepts’ defined by collections of raw inputs (e.g., feature vectors all from female patients could encode the concept ‘female’). For tabular data, we present visualization strategies that reveal how anchor directions relate to raw clinical features and to survival time distributions. We then show how these visualization ideas extend to handling raw inputs that are images. Our framework is built on looking at angles between vectors in an embedding space, where there could be ‘information loss’ by ignoring magnitude information. We show how this loss results in a ‘clumping’ artifact that appears in our visualizations, and how to reduce this information loss in practice.
arxiv情報
著者 | George H. Chen |
発行日 | 2023-05-11 15:01:30+00:00 |
arxivサイト | arxiv_id(pdf) |