要約
世宗辞書データセットは、形態論、構文、意味表現を広範囲にカバーする貴重なリソースを提供します。
このデータセットを利用すると、言語情報をより深く調査できます。
このデータセット内のラベル付き言語構造は、単語と句の間の関係、およびターゲット動詞との関連を明らかにするための基礎を形成します。
この文書では、特にサブカテゴリー化フレームに焦点を当てて、動詞関連情報の収集と統合のために設計されたユーザーフレンドリーな Web インターフェイスを紹介します。
さらに、サブカテゴリーのフレームを対応する文例に合わせてこの情報をマッピングする取り組みについても概説しています。
さらに、構文解析と意味的役割のラベル付けを簡素化する Python ライブラリも提供します。
これらのツールは、世宗辞書データセットを利用して韓国語処理用のアプリケーションを開発することに関心のある個人を支援することを目的としています。
要約(オリジナル)
The Sejong dictionary dataset offers a valuable resource, providing extensive coverage of morphology, syntax, and semantic representation. This dataset can be utilized to explore linguistic information in greater depth. The labeled linguistic structures within this dataset form the basis for uncovering relationships between words and phrases and their associations with target verbs. This paper introduces a user-friendly web interface designed for the collection and consolidation of verb-related information, with a particular focus on subcategorization frames. Additionally, it outlines our efforts in mapping this information by aligning subcategorization frames with corresponding illustrative sentence examples. Furthermore, we provide a Python library that would simplify syntactic parsing and semantic role labeling. These tools are intended to assist individuals interested in harnessing the Sejong dictionary dataset to develop applications for Korean language processing.
arxiv情報
著者 | Seohyun Song,Eunkyul Leah Jo,Yige Chen,Jeen-Pyo Hong,Kyuwon Kim,Jin Wee,Miyoung Kang,KyungTae Lim,Jungyeul Park,Chulwoo Park |
発行日 | 2024-12-01 14:32:47+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google