A Primer on Topological Data Analysis to Support Image Analysis Tasks in Environmental Science

要約

トポロジカルデータ分析(TDA)は、環境科学で波を起こし始めているデータサイエンスと数学のツールです。
この作業では、画像の分析、つまり永続的なホモロジーに特に役立つTDAのツールを直感的で理解しやすい方法で紹介します。
理論的背景について簡単に説明しますが、主にこのツールの出力を理解し、収集できる情報について説明します。
この目的のために、Rasp et。によって雲のメソカーレ組織の研究のために作成された砂糖、魚、花、砂利のデータセットから衛星画像を分類するガイド例を中心に議論を組み立てます。
al。
2020年(arXiv:1906:01906)。
永続的なホモロジーとそのベクトル化、永続的なランドスケープを、単純な機械学習アルゴリズムを使用したワークフローで使用して良好な結果を得る方法を示し、画像レベルの機能の観点からこの動作を説明する方法を詳しく説明します。
永続的ホモロジーのコアの強みの1つは、それがどれほど解釈可能であるかということです。したがって、このペーパー全体を通して、私たちが見つけたパターンだけでなく、永続的ホモロジーの理論について私たちが知っていることを考えると、なぜそれらの結果が期待されるのかについて説明します。
私たちの目標は、この論文の読者がTDAと永続的なホモロジーをよりよく理解し、永続的なホモロジーが役立つ可能性のある独自の問題とデータセットを特定し、それらを適用することで得られる結果を理解できるようにすることです。
含まれているGitHubサンプルコード。

要約(オリジナル)

Topological data analysis (TDA) is a tool from data science and mathematics that is beginning to make waves in environmental science. In this work, we seek to provide an intuitive and understandable introduction to a tool from TDA that is particularly useful for the analysis of imagery, namely persistent homology. We briefly discuss the theoretical background but focus primarily on understanding the output of this tool and discussing what information it can glean. To this end, we frame our discussion around a guiding example of classifying satellite images from the Sugar, Fish, Flower, and Gravel Dataset produced for the study of mesocale organization of clouds by Rasp et. al. in 2020 (arXiv:1906:01906). We demonstrate how persistent homology and its vectorization, persistence landscapes, can be used in a workflow with a simple machine learning algorithm to obtain good results, and explore in detail how we can explain this behavior in terms of image-level features. One of the core strengths of persistent homology is how interpretable it can be, so throughout this paper we discuss not just the patterns we find, but why those results are to be expected given what we know about the theory of persistent homology. Our goal is that a reader of this paper will leave with a better understanding of TDA and persistent homology, be able to identify problems and datasets of their own for which persistent homology could be helpful, and gain an understanding of results they obtain from applying the included GitHub example code.

arxiv情報

著者 Lander Ver Hoef,Henry Adams,Emily J. King,Imme Ebert-Uphoff
発行日 2022-07-21 15:51:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 55N31 (Primary) 62R40 (Secondary), cs.CV, cs.LG, J.2, math.GN, physics.ao-ph パーマリンク