要約
データ主導のアプローチは科学研究に革命をもたらしました。
この種の研究では、機械学習と統計分析が一般的に利用されます。
これらの方法論は広く使用されていますが、その手法と目的は大きく異なります。
社会科学、特に言語科学と認知科学におけるこれらの違いを実証するために一貫したデータセットを利用した研究はほとんどありません。
この研究では、Buckeye Speech Corpus を活用して、機械学習と統計分析の両方がデータ駆動型研究にどのように適用され、明確な洞察が得られるかを説明します。
この研究により、データ駆動型戦略で採用されている多様なアプローチについての理解が大幅に深まりました。
要約(オリジナル)
Data-driven approaches have revolutionized scientific research. Machine learning and statistical analysis are commonly utilized in this type of research. Despite their widespread use, these methodologies differ significantly in their techniques and objectives. Few studies have utilized a consistent dataset to demonstrate these differences within the social sciences, particularly in language and cognitive sciences. This study leverages the Buckeye Speech Corpus to illustrate how both machine learning and statistical analysis are applied in data-driven research to obtain distinct insights. This study significantly enhances our understanding of the diverse approaches employed in data-driven strategies.
arxiv情報
著者 | Kun Sun,Rong Wang |
発行日 | 2024-04-22 10:06:21+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google