Logion: Machine Learning for Greek Philology

要約

タイトル:「 Logion:ギリシャ文献学のための機械学習 」
要約:
– 古代ギリシャ語の文書伝達時に書記によって行われた先に検出していなかった誤りを識別および修正するために、BERT モデルを使用することで、ギリシャ文献学のさまざまな問題に対処するための機械学習手法を提供している。
– モデルを最も大きな先行研究がされた古代ギリシャのデータセットでトレーニングした後、文献伝達時に書記によって行われた先に検出していなかった誤りを識別および修正することに成功した後、モデルの能力は古代文書の物質的劣化に起因する欠損を補完することができることを示す。
– ドメインエキスパートとモデルのパフォーマンスを比較しました。人間とコンピュータの協力を前提として、モデルの可解性を探求し、特定の注意頭が古代ギリシャの選択的な文法的特徴をエンコードするように見えることを発見しました。

要約(オリジナル)

This paper presents machine-learning methods to address various problems in Greek philology. After training a BERT model on the largest premodern Greek dataset used for this purpose to date, we identify and correct previously undetected errors made by scribes in the process of textual transmission, in what is, to our knowledge, the first successful identification of such errors via machine learning. Additionally, we demonstrate the model’s capacity to fill gaps caused by material deterioration of premodern manuscripts and compare the model’s performance to that of a domain expert. We find that best performance is achieved when the domain expert is provided with model suggestions for inspiration. With such human-computer collaborations in mind, we explore the model’s interpretability and find that certain attention heads appear to encode select grammatical features of premodern Greek.

arxiv情報

著者 Charlie Cowen-Breen,Creston Brooks,Johannes Haubold,Barbara Graziosi
発行日 2023-05-01 21:56:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL, cs.LG, I.2.7 パーマリンク