Style Classification of Rabbinic Literature for Detection of Lost Midrash Tanhuma Material

要約

ミドラーシュのコレクションは、複数の言語のテキストで構成される複雑なラビの作品であり、不安定な口頭および書面による伝達の長いプロセスを経て進化しました。
このような編纂における特定の一節の出典を判断することは必ずしも簡単ではなく、学者の間で議論になることがよくありますが、学者がその一節とラビコーパス内の他のテキストとの関係を理解するためには、それが不可欠です。
この問題の解決を支援するために、ヘブライ語テキストの自然言語処理における最近の進歩を活用して、そのスタイルに基づいてラビ文献を分類するシステムを提案します。
さらに、この方法を適用して、後のアンソロジーに保存されている特定のミドラーシュ ジャンル、タンドマ・イェラムメデヌの失われた資料を発見する方法を示します。

要約(オリジナル)

Midrash collections are complex rabbinic works that consist of text in multiple languages, which evolved through long processes of unstable oral and written transmission. Determining the origin of a given passage in such a compilation is not always straightforward and is often a matter of dispute among scholars, yet it is essential for scholars’ understanding of the passage and its relationship to other texts in the rabbinic corpus. To help solve this problem, we propose a system for classification of rabbinic literature based on its style, leveraging recent advances in natural language processing for Hebrew texts. Additionally, we demonstrate how this method can be applied to uncover lost material from a specific midrash genre, Tan\d{h}uma-Yelammedenu, that has been preserved in later anthologies.

arxiv情報

著者 Shlomo Tannor,Nachum Dershowitz,Moshe Lavee
発行日 2023-07-24 05:39:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG パーマリンク