Explainable Multi-Label Classification of MBTI Types

要約

この研究では、Reddit の投稿と Kaggle データセットから Myers-Briggs Type Indicator (MBTI) のタイプを正確に分類するための最も効果的な機械学習モデルを特定することを目的としています。
Binary Relevance 法を使用してマルチラベル分類を適用します。
当社では、説明可能な人工知能 (XAI) アプローチを使用して、プロセスと結果の透明性と理解しやすさを強調しています。
これを達成するために、私たちはガラスボックス学習モデル、つまり、単純さ、透明性、解釈可能性を目指して設計されたモデルを実験します。
ガラスボックス モデルには、k 最近傍法、多項単純ベイズ、ロジスティック回帰を選択しました。
多項単純ベイズと k 近傍法は、オブザーバー (S) 特性を持つクラスが除外された場合にパフォーマンスが向上するのに対し、ロジスティック回帰はすべてのクラスのエントリが 550 を超える場合に最良の結果が得られることを示します。

要約(オリジナル)

In this study, we aim to identify the most effective machine learning model for accurately classifying Myers-Briggs Type Indicator (MBTI) types from Reddit posts and a Kaggle data set. We apply multi-label classification using the Binary Relevance method. We use Explainable Artificial Intelligence (XAI) approach to highlight the transparency and understandability of the process and result. To achieve this, we experiment with glass-box learning models, i.e. models designed for simplicity, transparency, and interpretability. We selected k-Nearest Neighbour, Multinomial Naive Bayes, and Logistic Regression for the glass-box models. We show that Multinomial Naive Bayes and k-Nearest Neighbour perform better if classes with Observer (S) traits are excluded, whereas Logistic Regression obtains its best results when all classes have > 550 entries.

arxiv情報

著者 Siana Kong,Marina Sokolova
発行日 2024-05-07 13:21:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, I.2.6 パーマリンク