Automated Code Extraction from Discussion Board Text Dataset

要約

タイトル:ディスカッションボードテキストデータセットからの自動コード抽出

要約:
– この研究は、Latent Semantic Analysis、Latent Dirichlet Analysis、Clustering Word Vectorsという3つの異なるテキストマイニングアプローチの能力を紹介し、比較することを目的としています。
– これらは比較的小規模なディスカッションボードデータセットからコード抽出を自動化するためのものです。
– 各アルゴリズムの出力結果を、2人の人間の観察者によって手動でコーディングを行った以前のデータセットと比較しました。
– 結果は、自動的なアプローチでも比較的小さなデータセットでも、授業の指導者にとって役立つディスカッションコードの一部を抽出できることを示しています。
– これらのコードは、Epistemic Network Analysisで使用することができます。

要点:
– ディスカッションボードのテキストデータセットから、自動的にコード抽出を行うことを目的とした研究
– Latent Semantic Analysis、Latent Dirichlet Analysis、Clustering Word Vectorsという3つの異なるテキストマイニングアプローチを比較
– 2人の人間の観察者によって手動でコーディングを行った以前のデータセットとの比較を行った
– 自動アルゴリズムでも、小さなデータセットでも、役立つディスカッションコードの一部を抽出できることを示した
– 抽出したコードは、Epistemic Network Analysisで使用可能

要約(オリジナル)

This study introduces and investigates the capabilities of three different text mining approaches, namely Latent Semantic Analysis, Latent Dirichlet Analysis, and Clustering Word Vectors, for automating code extraction from a relatively small discussion board dataset. We compare the outputs of each algorithm with a previous dataset that was manually coded by two human raters. The results show that even with a relatively small dataset, automated approaches can be an asset to course instructors by extracting some of the discussion codes, which can be used in Epistemic Network Analysis.

arxiv情報

著者 Sina Mahdipour Saravani,Sadaf Ghaffari,Yanye Luther,James Folkestad,Marcia Moraes
発行日 2023-04-18 22:51:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.LG パーマリンク