What about translation? New coding system for content analysis on the perception of literary translation around the political transformation in 1989 in Hungary as a classification problem on an unbalanced dataset

要約

ハンガリーにおける 1989 年の政治的変革を中心とした文学翻訳の認識の傾向を追跡するために、文学雑誌『Alf\’old』の 1980 年から 1999 年号の段落に関するコーディング システムが開発されました。
この論文では、文学雑誌 Nagyvil\’ag の 1980 ~ 1999 号までコーディング システムを引き継ぐために BERT モデルをトレーニングした方法について説明します。
広範なハイパーパラメータ調整、ラベルの不均衡に堅牢な損失関数、正確な評価のための 10 分割交差検証と予測のためのモデルアンサンブル、予測セットの手動検証、ナジビルのセクションのラベル数をより適切に予測するための新しいキャリブレーション方法を使用しています。
コーパスを作成し、ラベル間の関係を研究するために、ラベル関係ネットワークを構築します。

要約(オリジナル)

To track trends in the perception of literary translation around the political transformation in 1989 in Hungary, a coding system was developed on the paragraphs of the 1980-1999 issues of the literary journal Alf\’old. This paper describes how we trained BERT models to carry over the coding system to the 1980-1999 issues of the literary journal Nagyvil\’ag. We use extensive hyperparameter tuning, loss functions robust to label unbalance, 10-fold cross-validation for precise evaluations and a model ensemble for prediction, manual validation on the predict set, a new calibration method to better predict label counts for sections of the Nagyvil\’ag corpus, and to study the relations between labels, we construct label relation networks.

arxiv情報

著者 Dalma Galambos,Pál Zsámboki
発行日 2023-08-07 17:46:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク