要約
我々は、同じ主題に関する主データセットと補助データセットを与えられたクラスタリングのための一般的な転移学習フレームワークを提案します。
2 つのデータセットは、被験者の類似しているが異なる潜在的なグループ化構造を反映している可能性があります。
推定されたバイアス分散分解を最適化することにより、未知の不一致が存在する場合に共通性を自動的に活用する適応型転送クラスタリング (ATC) アルゴリズムを提案します。
これは、混合ガウス モデル、確率ブロック モデル、潜在クラス モデルなどの幅広いクラスの統計モデルに適用されます。
理論分析により、混合ガウス モデルの下での ATC の最適性が証明され、転送の利点が明確に定量化されます。
広範なシミュレーションと実際のデータ実験により、さまざまなシナリオにおける私たちの方法の有効性が確認されています。
要約(オリジナル)
We propose a general transfer learning framework for clustering given a main dataset and an auxiliary one about the same subjects. The two datasets may reflect similar but different latent grouping structures of the subjects. We propose an adaptive transfer clustering (ATC) algorithm that automatically leverages the commonality in the presence of unknown discrepancy, by optimizing an estimated bias-variance decomposition. It applies to a broad class of statistical models including Gaussian mixture models, stochastic block models, and latent class models. A theoretical analysis proves the optimality of ATC under the Gaussian mixture model and explicitly quantifies the benefit of transfer. Extensive simulations and real data experiments confirm our method’s effectiveness in various scenarios.
arxiv情報
著者 | Yuqi Gu,Zhongyuan Lyu,Kaizheng Wang |
発行日 | 2024-10-28 17:57:06+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google