Choosing the parameter of the Fermat distance: navigating geometry and noise

要約

フェルマー距離は、自然な距離を実践者が直接利用できない場合、またはデータセットの幾何学的および統計的特性を展開することによってユークリッド距離によって得られる結果を改善するための機械学習タスクに役立つツールとして最近確立されました。
この距離はパラメータ $\alpha$ に依存し、後続のタスクのパフォーマンスに大きな影響を与えます。
理想的には、$\alpha$ の値は、問題に固有の幾何学的複雑さをナビゲートするのに十分な大きさである必要があります。
同時に、距離推定のプロセス中にノイズに起因する有害な影響を回避するために、十分な抑制を維持する必要があります。
このパラメータを選択する方法を理論とシミュレーションの両方で研究します。

要約(オリジナル)

The Fermat distance has been recently established as a useful tool for machine learning tasks when a natural distance is not directly available to the practitioner or to improve the results given by Euclidean distances by exploding the geometrical and statistical properties of the dataset. This distance depends on a parameter $\alpha$ that greatly impacts the performance of subsequent tasks. Ideally, the value of $\alpha$ should be large enough to navigate the geometric intricacies inherent to the problem. At the same, it should remain restrained enough to sidestep any deleterious ramifications stemming from noise during the process of distance estimation. We study both theoretically and through simulations how to select this parameter.

arxiv情報

著者 Frédéric Chazal,Laure Ferraris,Pablo Groisman,Matthieu Jonckheere,Frédéric Pascal,Facundo Sapienza
発行日 2023-11-30 16:11:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, math.PR, stat.ML パーマリンク