要約
この研究では、トークン分類のための BERT アーキテクチャによる転移学習を使用して文の骨格構造を抽出する品詞 (POS) タグ付けモデルの開発について説明します。
このモデルはロシア語のテキストに基づいて微調整されており、その有効性を示しています。
このアプローチは、機械翻訳の改善など、自然言語処理タスクの強化に応用できる可能性をもたらします。
キーワード: 品詞タグ付け、形態素解析、自然言語処理、BERT。
要約(オリジナル)
This study presents the development of a part-of-speech (POS) tagging model to extract the skeletal structure of sentences using transfer learning with the BERT architecture for token classification. The model, fine-tuned on Russian text, demonstrating its effectiveness. The approach offers potential applications in enhancing natural language processing tasks, such as improving machine translation. Keywords: part of speech tagging, morphological analysis, natural language processing, BERT.
arxiv情報
著者 | Grigorii Churakov |
発行日 | 2024-11-21 18:25:19+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google