A Statistical Exploration of Text Partition Into Constituents: The Case of the Priestly Source in the Books of Genesis and Exodus

要約

タイトル:創世記と出エジプト記における「司祭的な要素」のテキスト分割の統計的探索

要約:

– スタイロメトリーに基づく説明と統計的検証を提供する統計的テキスト探索のパイプラインを提案する。
– パラメータ化されたテキストが与えられた場合、パイプラインは次のことを行います:(1)仮説と無監督分割の間の最適な重複を生み出す文学的特徴を検出し、(2)仮設検定分析を実行して、最適な重複の統計的有意性を量化し、よりグループ化されるテキストユニット間の暗黙的相関を保存します。(3)分類に最も責任を持つ特徴を抽出して、その統計的安定性とクラスターごとの豊富さを推定する。
– 著名な聖書学者たちにとって目立つ、司祭的な要素に関して、聖書の最初の2冊でパイプラインを適用する。司祭的要素とそれ以外の要素の統計的に有意なスタイルの違いを特定し、探索します。

要約(オリジナル)

We present a pipeline for a statistical textual exploration, offering a stylometry-based explanation and statistical validation of a hypothesized partition of a text. Given a parameterization of the text, our pipeline: (1) detects literary features yielding the optimal overlap between the hypothesized and unsupervised partitions, (2) performs a hypothesis-testing analysis to quantify the statistical significance of the optimal overlap, while conserving implicit correlations between units of text that are more likely to be grouped, and (3) extracts and quantifies the importance of features most responsible for the classification, estimates their statistical stability and cluster-wise abundance. We apply our pipeline to the first two books in the Bible, where one stylistic component stands out in the eyes of biblical scholars, namely, the Priestly component. We identify and explore statistically significant stylistic differences between the Priestly and non-Priestly components.

arxiv情報

著者 Gideon Yoffe,Axel Bühler,Nachum Dershowitz,Israel Finkelstein,Eli Piasetzky,Thomas Römer,Barak Sober
発行日 2023-05-04 17:07:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク