Adversarial random forests for density estimation and generative modeling

要約

新しい形式の教師なしランダム フォレストを使用した密度推定とデータ合成の方法を提案します。
敵対的生成ネットワークに着想を得て、生成と識別を交互に繰り返すことで、ツリーがデータの構造特性を徐々に学習する再帰的な手順を実装します。
この方法は、最小限の仮定の下で一貫性があることが証明されています。
古典的なツリーベースの代替手段とは異なり、私たちのアプローチは滑らかな (無) 条件の密度を提供し、完全な合成データ生成を可能にします。
平均して約 2 桁高速に実行しながら、さまざまな表形式のデータ ベンチマークで最先端の確率回路およびディープ ラーニング モデルと同等またはそれ以上のパフォーマンスを達成します。
付属の $\texttt{R}$ パッケージ $\texttt{arf}$ は、$\texttt{CRAN}$ で入手できます。

要約(オリジナル)

We propose methods for density estimation and data synthesis using a novel form of unsupervised random forests. Inspired by generative adversarial networks, we implement a recursive procedure in which trees gradually learn structural properties of the data through alternating rounds of generation and discrimination. The method is provably consistent under minimal assumptions. Unlike classic tree-based alternatives, our approach provides smooth (un)conditional densities and allows for fully synthetic data generation. We achieve comparable or superior performance to state-of-the-art probabilistic circuits and deep learning models on various tabular data benchmarks while executing about two orders of magnitude faster on average. An accompanying $\texttt{R}$ package, $\texttt{arf}$, is available on $\texttt{CRAN}$.

arxiv情報

著者 David S. Watson,Kristin Blesch,Jan Kapar,Marvin N. Wright
発行日 2023-03-13 16:15:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, stat.CO, stat.ML パーマリンク