要約
機械学習の分類問題は生物情報学で広く普及していますが、モデルのトレーニング、最適化、推論を実行するために必要な技術的知識により、研究者がこのテクノロジーを利用できない可能性があります。
この記事では、データの有益な視覚化と洞察を提供しながら、モデルのトレーニングと結果生成のプロセスを簡素化する機械学習分類問題用の自動ツールを紹介します。
このツールは、バイナリ分類問題とマルチクラス分類問題の両方をサポートし、さまざまなモデルやメソッドへのアクセスを提供します。
インターフェイス内で合成データを生成して、欠損値を埋めたり、クラス ラベルのバランスをとったり、まったく新しいデータセットを生成したりできます。
また、特徴評価のサポートも提供し、どの特徴が出力に最も影響を与えるかを示す説明可能性スコアを生成します。
CLASSify は、機械学習の知識を必要とせずに分類問題を解決するユーザー エクスペリエンスを簡素化するオープンソース ツールです。
要約(オリジナル)
Machine learning classification problems are widespread in bioinformatics, but the technical knowledge required to perform model training, optimization, and inference can prevent researchers from utilizing this technology. This article presents an automated tool for machine learning classification problems to simplify the process of training models and producing results while providing informative visualizations and insights into the data. This tool supports both binary and multiclass classification problems, and it provides access to a variety of models and methods. Synthetic data can be generated within the interface to fill missing values, balance class labels, or generate entirely new datasets. It also provides support for feature evaluation and generates explainability scores to indicate which features influence the output the most. We present CLASSify, an open-source tool for simplifying the user experience of solving classification problems without the need for knowledge of machine learning.
arxiv情報
著者 | Aaron D. Mullen,Samuel E. Armstrong,Jeff Talbert,V. K. Cody Bumgardner |
発行日 | 2023-10-05 15:51:36+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google