Xputer: Bridging Data Gaps with NMF, XGBoost, and a Streamlined GUI Experience

要約

さまざまな分野にわたるデータの急速な急増により、欠損値を正確に代入することの重要性が強調されています。
このタスクは、データの整合性を確保し、有意義な洞察を引き出すために非常に重要です。
この課題に応えて、Non-negative Matrix Factorization (NMF) と XGBoost の予測機能を適切に統合する新しい補完ツールである Xputer を紹介します。
Xputer の際立った機能の 1 つはその多用途性です。Xputer はゼロ代入をサポートし、Optuna によるハイパーパラメーターの最適化を可能にし、ユーザーが反復回数を定義できるようにします。
ユーザー エクスペリエンスとアクセシビリティを強化するために、Xputer には直観的なグラフィカル ユーザー インターフェイス (GUI) が装備されており、計算ツールにあまり慣れていない人でも扱いやすくなっています。
パフォーマンス ベンチマークでは、Xputer は IterativeImputer などの確立されたツールの計算速度に匹敵するだけでなく、代入精度の点でもそれらを上回ることがよくあります。
さらに、Xputer はカテゴリカル、連続、ブールなどのさまざまなデータ型を自律的に処理するため、事前の前処理が不要になります。
Xputer は、パフォーマンス、柔軟性、ユーザーフレンドリーな設計の融合により、データ代入の分野における最先端のソリューションとして浮上します。

要約(オリジナル)

The rapid proliferation of data across diverse fields has accentuated the importance of accurate imputation for missing values. This task is crucial for ensuring data integrity and deriving meaningful insights. In response to this challenge, we present Xputer, a novel imputation tool that adeptly integrates Non-negative Matrix Factorization (NMF) with the predictive strengths of XGBoost. One of Xputer’s standout features is its versatility: it supports zero imputation, enables hyperparameter optimization through Optuna, and allows users to define the number of iterations. For enhanced user experience and accessibility, we have equipped Xputer with an intuitive Graphical User Interface (GUI) ensuring ease of handling, even for those less familiar with computational tools. In performance benchmarks, Xputer not only rivals the computational speed of established tools such as IterativeImputer but also often outperforms them in terms of imputation accuracy. Furthermore, Xputer autonomously handles a diverse spectrum of data types, including categorical, continuous, and Boolean, eliminating the need for prior preprocessing. Given its blend of performance, flexibility, and user-friendly design, Xputer emerges as a state-of-the-art solution in the realm of data imputation.

arxiv情報

著者 Saleena Younus,Lars Rönnstrand,Julhash U. Kazi
発行日 2023-11-16 16:07:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, q-bio.QM, stat.ME パーマリンク