Personality Style Recognition via Machine Learning: Identifying Anaclitic and Introjective Personality Styles from Patients’ Speech

要約

精神病理学で観察される不均一性を解きほぐすには、患者の個性が重要であると考えられます。
性格特性が患者が使用する言語に反映されることは実証されていますが、これにより、性格分類用に明示的に設計された従来のアンケートベースのアプローチよりも正確に、音声発話から直接性格タイプを自動的に推測できる可能性があると仮説を立てています。

この仮説を検証するために、分類に自然言語処理 (NLP) と標準の機械学習ツールを採用します。
私たちはこれを、大うつ病性障害(MDD)と診断された79人の患者サンプル(性格スタイルに基づいて差別化した治療法が提唱されている)の記録された臨床診断面接(CDI)のデータセットで検証し、アナクリティックとアナクリティックに分類した。
内省的な性格スタイル。
私たちは、スタイルをより深く理解するために、インタビューを分析して、どの言語的特徴が各スタイルに関連付けられているかを確認することから始めます。
次に、(a) 標準化されたアンケート回答に基づいて自動分類器を開発します。
(b) 基本的なテキストの特徴、つまり単語および単語シーケンスの TF-IDF スコア。
(c) LIWC (言語調査と単語カウント) を使用したより高度なテキスト機能と、BERT (トランスフォーマーからの双方向エンコーダー表現) を使用したコンテキスト認識機能。
(d) オーディオ機能。
言語由来の特徴 (つまり、LIWC に基づく) を使用した自動分類は、アンケートベースの分類モデルよりも大幅に優れていることがわかりました。
さらに、LIWC とアンケート機能を組み合わせることで、最高のパフォーマンスが実現されます。
これは、性格を特徴付けるための言語ベースの自動化技術の開発にもっと取り組む必要があることを示唆していますが、アンケートは依然としてある程度そのような方法を補完します。

要約(オリジナル)

In disentangling the heterogeneity observed in psychopathology, personality of the patients is considered crucial. While it has been demonstrated that personality traits are reflected in the language used by a patient, we hypothesize that this enables automatic inference of the personality type directly from speech utterances, potentially more accurately than through a traditional questionnaire-based approach explicitly designed for personality classification. To validate this hypothesis, we adopt natural language processing (NLP) and standard machine learning tools for classification. We test this on a dataset of recorded clinical diagnostic interviews (CDI) on a sample of 79 patients diagnosed with major depressive disorder (MDD) — a condition for which differentiated treatment based on personality styles has been advocated — and classified into anaclitic and introjective personality styles. We start by analyzing the interviews to see which linguistic features are associated with each style, in order to gain a better understanding of the styles. Then, we develop automatic classifiers based on (a) standardized questionnaire responses; (b) basic text features, i.e., TF-IDF scores of words and word sequences; (c) more advanced text features, using LIWC (linguistic inquiry and word count) and context-aware features using BERT (bidirectional encoder representations from transformers); (d) audio features. We find that automated classification with language-derived features (i.e., based on LIWC) significantly outperforms questionnaire-based classification models. Furthermore, the best performance is achieved by combining LIWC with the questionnaire features. This suggests that more work should be put into developing linguistically based automated techniques for characterizing personality, however questionnaires still to some extent complement such methods.

arxiv情報

著者 Semere Kiros Bitew,Vincent Schelstraete,Klim Zaporojets,Kimberly Van Nieuwenhove,Reitske Meganck,Chris Develder
発行日 2023-11-07 15:56:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク