要約
循環および非フラットのデータ分布は、データサイエンスの多様なドメイン全体で一般的ですが、それらの特定の幾何学的構造は、しばしば機械学習フレームワークでは十分に活用されていません。
このようなデータの基礎となるジオメトリを考慮するための原則的なアプローチは、特に広範なガウス分布のように統計モデルを拡張する場合に極めて重要です。
この作業では、情報ジオメトリの重要な焦点である対称陽性の明確なマトリックスの多様体に焦点を当てることにより、これらの問題に取り組みます。
指数マップを活用することにより、非等方性ラップされたガウスを導入しました。この分布の理論的特性を導き出し、パラメーター推定のための最尤フレームワークを提案します。
さらに、確立されたレンズを介してSPDの確立された分類子を再解釈し、ラップされたガウスモデルに基づいて新しい分類子を導入します。
合成および実世界のデータセットの実験は、この幾何学的認識分布の堅牢性と柔軟性を示しており、マニホールドベースのデータ分析を進める可能性を強調しています。
この作業は、古典的な機械学習と統計的方法をより複雑で構造化されたデータに拡張するための基礎を築きます。
要約(オリジナル)
Circular and non-flat data distributions are prevalent across diverse domains of data science, yet their specific geometric structures often remain underutilized in machine learning frameworks. A principled approach to accounting for the underlying geometry of such data is pivotal, particularly when extending statistical models, like the pervasive Gaussian distribution. In this work, we tackle those issue by focusing on the manifold of symmetric positive definite matrices, a key focus in information geometry. We introduced a non-isotropic wrapped Gaussian by leveraging the exponential map, we derive theoretical properties of this distribution and propose a maximum likelihood framework for parameter estimation. Furthermore, we reinterpret established classifiers on SPD through a probabilistic lens and introduce new classifiers based on the wrapped Gaussian model. Experiments on synthetic and real-world datasets demonstrate the robustness and flexibility of this geometry-aware distribution, underscoring its potential to advance manifold-based data analysis. This work lays the groundwork for extending classical machine learning and statistical methods to more complex and structured data.
arxiv情報
著者 | Thibault de Surrel,Fabien Lotte,Sylvain Chevallier,Florian Yger |
発行日 | 2025-02-12 18:11:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google