StepMix: A Python Package for Pseudo-Likelihood Estimation of Generalized Mixture Models with External Variables

要約

StepMix は、外部変数 (共変量と遠位結果) を使用した一般化有限混合モデル (潜在プロファイルと潜在クラス分析) の擬似尤度推定 (1 ステップ、2 ステップ、および 3 ステップ アプローチ) のためのオープンソース Python パッケージです。
社会科学における多くのアプリケーションでは、主な目的は個人を潜在的なクラスにクラスター化するだけでなく、これらのクラスを使用してより複雑な統計モデルを開発することも目的としています。
これらのモデルは通常、潜在クラスを観察された指標に関連付ける測定モデルと、共変量および結果変数を潜在クラスに関連付ける構造モデルに分かれます。
測定モデルと構造モデルは、いわゆるワンステップアプローチを使用して一緒に推定することも、ステップワイズ法を使用して逐次的に推定することもできます。これは、推定された潜在クラスの解釈可能性に関して実務者に大きな利点をもたらします。
1 ステップ アプローチに加えて、StepMix は、BCH および ML 補正によるバイアス調整された 3 ステップ メソッドや、より最近の 2 ステップ アプローチなど、文献からの最も重要な段階的推定メソッドを実装します。
この論文では、これらの疑似尤度推定器を、統一されたフレームワークの下で、特定の期待値最大化サブルーチンとして示します。
データ サイエンス コミュニティでの採用を促進および促進するために、StepMix は scikit-learn ライブラリのオブジェクト指向設計に従い、追加の R ラッパーを提供します。

要約(オリジナル)

StepMix is an open-source Python package for the pseudo-likelihood estimation (one-, two- and three-step approaches) of generalized finite mixture models (latent profile and latent class analysis) with external variables (covariates and distal outcomes). In many applications in social sciences, the main objective is not only to cluster individuals into latent classes, but also to use these classes to develop more complex statistical models. These models generally divide into a measurement model that relates the latent classes to observed indicators, and a structural model that relates covariates and outcome variables to the latent classes. The measurement and structural models can be estimated jointly using the so-called one-step approach or sequentially using stepwise methods, which present significant advantages for practitioners regarding the interpretability of the estimated latent classes. In addition to the one-step approach, StepMix implements the most important stepwise estimation methods from the literature, including the bias-adjusted three-step methods with BCH and ML corrections and the more recent two-step approach. These pseudo-likelihood estimators are presented in this paper under a unified framework as specific expectation-maximization subroutines. To facilitate and promote their adoption among the data science community, StepMix follows the object-oriented design of the scikit-learn library and provides an additional R wrapper.

arxiv情報

著者 Sacha Morin,Robin Legault,Félix Laliberté,Zsuzsa Bakk,Charles-Édouard Giguère,Roxane de la Sablonnière,Éric Lacourse
発行日 2023-08-25 16:11:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ME, stat.ML パーマリンク