Archetypal Analysis for Binary Data

要約

典型的な分析(AA)は、各データポイントが順番にアーキタイプの凸の組み合わせとして再構築され、データポイントの凸の組み合わせを使用して異なるパターンを識別するマトリックス分解法です。
これにより、データ内の異なる側面のトレードオフを表すポリトープを形成します。
AAの既存のほとんどの方法は、継続的なデータ用に設計されており、データ分布の構造を活用しません。
この論文では、バイナリデータの典型的な分析のための2つの新しい最適化フレームワークを提案します。
i)アーキタイプを定義する凸の組み合わせを学習するためのアクティブなセット手順を使用して、効率的な閉じた形式の更新を備えたベルヌーリ分布に基づくAA尤度の2次近似。
ii)ベルヌーウリの尤度ベースのバージョン主要な凸型船体分析(PCHA)アルゴリズムのバージョンは、最小二乗最適化のために元々開発されました。
これらのアプローチを、乗法更新に依存する唯一の既存のバイナリAA手順と比較し、合成データと実際のバイナリデータの両方でそれらの優位性を示します。
特に、AAの提案された最適化フレームワークは、基礎となるデータ分布を反映した調整された尤度関数に基づいて、AAの一般的な効率的な最適化フレームワークを提供する他のデータ分布に簡単に拡張できます。

要約(オリジナル)

Archetypal analysis (AA) is a matrix decomposition method that identifies distinct patterns using convex combinations of the data points denoted archetypes with each data point in turn reconstructed as convex combinations of the archetypes. AA thereby forms a polytope representing trade-offs of the distinct aspects in the data. Most existing methods for AA are designed for continuous data and do not exploit the structure of the data distribution. In this paper, we propose two new optimization frameworks for archetypal analysis for binary data. i) A second order approximation of the AA likelihood based on the Bernoulli distribution with efficient closed-form updates using an active set procedure for learning the convex combinations defining the archetypes, and a sequential minimal optimization strategy for learning the observation specific reconstructions. ii) A Bernoulli likelihood based version of the principal convex hull analysis (PCHA) algorithm originally developed for least squares optimization. We compare these approaches with the only existing binary AA procedure relying on multiplicative updates and demonstrate their superiority on both synthetic and real binary data. Notably, the proposed optimization frameworks for AA can easily be extended to other data distributions providing generic efficient optimization frameworks for AA based on tailored likelihood functions reflecting the underlying data distribution.

arxiv情報

著者 A. Emilie J. Wedenborg,Morten Mørup
発行日 2025-02-06 16:05:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, stat.ML パーマリンク