Dream Content Discovery from Reddit with an Unsupervised Mixed-Method Approach


従来の夢分析手法は人気があり、130 を超える独自の尺度や評価システムによって支援されていますが、限界もあります。
私たちはこの方法を Reddit の r/Dreams サブレディットからの 44,213 件の夢レポートでテストしました。そこでは 217 件のトピックが見つかり、22 の大きなテーマにグループ化されました。これは、これまでで最も広範な夢トピックのコレクションです。
私たちは、広く使用されているホール アンド ヴァン デ キャッスル スケールと比較することで、トピックを検証しました。


Dreaming is a fundamental but not fully understood part of human experience that can shed light on our thought patterns. Traditional dream analysis practices, while popular and aided by over 130 unique scales and rating systems, have limitations. Mostly based on retrospective surveys or lab studies, they struggle to be applied on a large scale or to show the importance and connections between different dream themes. To overcome these issues, we developed a new, data-driven mixed-method approach for identifying topics in free-form dream reports through natural language processing. We tested this method on 44,213 dream reports from Reddit’s r/Dreams subreddit, where we found 217 topics, grouped into 22 larger themes: the most extensive collection of dream topics to date. We validated our topics by comparing it to the widely-used Hall and van de Castle scale. Going beyond traditional scales, our method can find unique patterns in different dream types (like nightmares or recurring dreams), understand topic importance and connections, and observe changes in collective dream experiences over time and around major events, like the COVID-19 pandemic and the recent Russo-Ukrainian war. We envision that the applications of our method will provide valuable insights into the intricate nature of dreaming.


著者 Anubhab Das,Sanja Šćepanović,Luca Maria Aiello,Remington Mallett,Deirdre Barrett,Daniele Quercia
発行日 2023-07-09 13:24:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CY, H.4.0; K.4.0, physics.soc-ph パーマリンク