Bayesian taut splines for estimating the number of modes

要約

確率密度関数のモードの数はモデルの複雑さを表し、既存の部分母集団の数とみなすこともできます。
その関連性にもかかわらず、その推定に関する研究はほとんど行われていません。
単変量設定に焦点を当て、問題の見落とされているいくつかの側面からインスピレーションを得て、予測精度をターゲットとした新しいアプローチを提案します。
私たちは、ソリューションにおける構造の必要性、モードの主観的で不確実な性質、およびグローバルとローカルの密度特性を混合した全体的なビューの利便性を主張します。
私たちの方法は、柔軟なカーネル推定器と節約された構成スプラインの組み合わせに基づいて構築されています。
特徴探索、モデル選択、モード テストはベイジアン推論パラダイムで実装されており、ソフト ソリューションを提供し、プロセスに専門家の判断を組み込むことができます。
私たちの提案の有用性は、複数のコンパニオン視覚化ツールを紹介するスポーツ分析のケーススタディを通じて説明されています。
徹底したシミュレーション研究により、従来のモダリティ主導のアプローチでは、逆説的に正確な結果を得るのに苦労していることが実証されました。
この文脈において、当社の手法は、アナリストに革新的なソリューションを提供する最上位の代替手段として浮上します。

要約(オリジナル)

The number of modes in a probability density function is representative of the model’s complexity and can also be viewed as the number of existing subpopulations. Despite its relevance, little research has been devoted to its estimation. Focusing on the univariate setting, we propose a novel approach targeting prediction accuracy inspired by some overlooked aspects of the problem. We argue for the need for structure in the solutions, the subjective and uncertain nature of modes, and the convenience of a holistic view blending global and local density properties. Our method builds upon a combination of flexible kernel estimators and parsimonious compositional splines. Feature exploration, model selection and mode testing are implemented in the Bayesian inference paradigm, providing soft solutions and allowing to incorporate expert judgement in the process. The usefulness of our proposal is illustrated through a case study in sports analytics, showcasing multiple companion visualisation tools. A thorough simulation study demonstrates that traditional modality-driven approaches paradoxically struggle to provide accurate results. In this context, our method emerges as a top-tier alternative offering innovative solutions for analysts.

arxiv情報

著者 José E. Chacón,Javier Fernández Serrano
発行日 2023-07-21 09:47:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 62C10, 62C86 (Secondary), 62F15, 62G05, cs.LG, math.ST, stat.ME, stat.ML, stat.TH パーマリンク