Offline versus Online Triplet Mining based on Extreme Distances of Histopathology Patches

要約

10万パッチを含む大腸癌病理組織データセットに対して,オフラインとオンラインのトリプレットマイニングの効果を分析する.我々は、オンラインとオフラインの両方のマイニングにおいて、極端な、すなわち、与えられたアンカーから最も遠いパッチと最も近いパッチを考慮する。多くの研究がオンライン(バッチ式)でトリプレットを選択することのみに焦点を当てているのに対し、我々はオフラインで学習する前に極端な距離と近傍パッチの効果も研究している。我々は、イージーポジティブ、バッチセミハード、バッチハードトリプレットマイニング、近傍成分分析ロス、その代理バージョン、距離加重サンプリングなど、オフラインとオンラインのマイニングにおける埋め込み距離の観点から、極端なケースの影響を分析する。また、極限距離に基づくオンラインアプローチを検討し、データパターンに基づいてオフラインとオンラインのマイニング性能を包括的に比較し、オフラインマイニングが大きなミニバッチサイズを持つオンラインマイニングの扱いやすい一般化であることを説明する。また、異なる大腸組織タイプの関係を極値距離の観点から議論する。本研究では、ResNet-18のような特定のアーキテクチャにおいて、オフラインマイニングとオンラインマイニングのアプローチが同等の性能を持つことを見出した。さらに、異なる極限距離を含むアソートケースは、特にオンラインアプローチにおいて有望であることが分かった。

要約(オリジナル)

We analyze the effect of offline and online triplet mining for colorectal cancer (CRC) histopathology dataset containing 100,000 patches. We consider the extreme, i.e., farthest and nearest patches to a given anchor, both in online and offline mining. While many works focus solely on selecting the triplets online (batch-wise), we also study the effect of extreme distances and neighbor patches before training in an offline fashion. We analyze extreme cases’ impacts in terms of embedding distance for offline versus online mining, including easy positive, batch semi-hard, batch hard triplet mining, neighborhood component analysis loss, its proxy version, and distance weighted sampling. We also investigate online approaches based on extreme distance and comprehensively compare offline, and online mining performance based on the data patterns and explain offline mining as a tractable generalization of the online mining with large mini-batch size. As well, we discuss the relations of different colorectal tissue types in terms of extreme distances. We found that offline and online mining approaches have comparable performances for a specific architecture, such as ResNet-18 in this study. Moreover, we found the assorted case, including different extreme distances, is promising, especially in the online approach.

arxiv情報

著者 Milad Sikaroudi,Benyamin Ghojogh,Amir Safarpoor,Fakhri Karray,Mark Crowley,H. R. Tizhoosh
発行日 2022-08-10 05:39:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク