Figuratively Speaking: Authorship Attribution via Multi-Task Figurative Language Modeling

要約

テキスト内の比喩言語 (FL) の特徴を特定することは、さまざまな自然言語処理 (NLP) タスクにとって重要であり、著者の意図した意味とそのニュアンスを理解することがコミュニケーションを成功させる鍵となります。
同時に、単なる比喩や皮肉などの単一の構成要素を使用するのではなく、さまざまな FL 形式の特定のブレンドを使用することが、作家のスタイルを最も正確に反映します。
したがって、FL の特徴は著者帰属 (AA) タスクにおいて重要な役割を果たす可能性があると仮定します。
私たちは、FL の使用に基づいた AA の最初の計算研究であると信じています。
したがって、テキスト内の複数の FL 特徴を一度に検出することを学習するマルチタスク比喩言語モデル (MFLM) を提案します。
複数のテスト セットにわたる詳細な評価を通じて、このモデルが FL 検出において特殊なバイナリ モデルと同等またはそれを上回るパフォーマンスを発揮する傾向があることを実証します。
続いて、3 つのデータセットで AA タスクに対する結合 FL 特徴の予測能力を評価し、MFLM 埋め込みの統合による AA パフォーマンスの向上を観察します。

要約(オリジナル)

The identification of Figurative Language (FL) features in text is crucial for various Natural Language Processing (NLP) tasks, where understanding of the author’s intended meaning and its nuances is key for successful communication. At the same time, the use of a specific blend of various FL forms most accurately reflects a writer’s style, rather than the use of any single construct, such as just metaphors or irony. Thus, we postulate that FL features could play an important role in Authorship Attribution (AA) tasks. We believe that our is the first computational study of AA based on FL use. Accordingly, we propose a Multi-task Figurative Language Model (MFLM) that learns to detect multiple FL features in text at once. We demonstrate, through detailed evaluation across multiple test sets, that the our model tends to perform equally or outperform specialized binary models in FL detection. Subsequently, we evaluate the predictive capability of joint FL features towards the AA task on three datasets, observing improved AA performance through the integration of MFLM embeddings.

arxiv情報

著者 Gregorios A Katsios,Ning Sa,Tomek Strzalkowski
発行日 2024-06-12 13:49:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク