Bayesian taut splines for estimating the number of modes

要約

確率密度関数のモードの数はモデルの複雑さを表し、部分母集団の数とみなすこともできます。
関連性があるにもかかわらず、この分野に関する研究は限られています。
単変量設定におけるモードの数を推定するための新しいアプローチが提示されます。これは、予測精度に焦点を当て、問題の見落とされているいくつかの側面、つまり、解における構造の必要性、モードの主観的で不確実な性質、および利便性などからインスピレーションを得たものです。
ローカルとグローバルの密度プロパティを融合した全体的なビュー。
この技術は、ベイジアン推論パラダイムにおける柔軟なカーネル推定器と倹約的な構成スプラインを組み合わせて、ソフトなソリューションを提供し、専門家の判断を組み込みます。
この手順には、機能の探索、モデルの選択、モードのテストが含まれており、複数のコンパニオン視覚化ツールを紹介するスポーツ分析のケーススタディで説明されています。
徹底的なシミュレーション研究では、従来のモダリティ主導のアプローチでは、逆説的に正確な結果を得るのが難しいことも実証されています。
この文脈において、新しい手法は最上位の代替手段として浮上し、アナリストに革新的なソリューションを提供します。

要約(オリジナル)

The number of modes in a probability density function is representative of the complexity of a model and can also be viewed as the number of subpopulations. Despite its relevance, there has been limited research in this area. A novel approach to estimating the number of modes in the univariate setting is presented, focusing on prediction accuracy and inspired by some overlooked aspects of the problem: the need for structure in the solutions, the subjective and uncertain nature of modes, and the convenience of a holistic view that blends local and global density properties. The technique combines flexible kernel estimators and parsimonious compositional splines in the Bayesian inference paradigm, providing soft solutions and incorporating expert judgment. The procedure includes feature exploration, model selection, and mode testing, illustrated in a sports analytics case study showcasing multiple companion visualisation tools. A thorough simulation study also demonstrates that traditional modality-driven approaches paradoxically struggle to provide accurate results. In this context, the new method emerges as a top-tier alternative, offering innovative solutions for analysts.

arxiv情報

著者 José E. Chacón,Javier Fernández Serrano
発行日 2024-05-08 15:56:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: (Primary), 62C10, 62F15, cs.LG, math.ST, secondary, stat.ME, stat.ML, stat.TH パーマリンク