要約
私たちは、テキスト内の曖昧さと主観性を自動測定するためのハイブリッド アプローチを紹介します。
まずエキスパート システム VAGO を導入し、事実と意見の文の小規模なベンチマークでそれを図示し、次に大規模なフランスのプレス コーパス FreSaDa でテストして、風刺的なテキストと通常のテキストの主観的マーカーの普及率が高いことを確認します。
次に、FreSaDa で取得したシンボリック VAGO スコアに基づいてトレーニングされた、BERT のようなアーキテクチャに基づいて VAGO のニューラル クローンを構築します。
説明可能ツール (LIME) を使用して、このニューラル バージョンがシンボリック バージョンの語彙を強化したり、他の言語でバージョンを作成したりすることに興味があることを示します。
要約(オリジナル)
We present a hybrid approach to the automated measurement of vagueness and subjectivity in texts. We first introduce the expert system VAGO, we illustrate it on a small benchmark of fact vs. opinion sentences, and then test it on the larger French press corpus FreSaDa to confirm the higher prevalence of subjective markers in satirical vs. regular texts. We then build a neural clone of VAGO, based on a BERT-like architecture, trained on the symbolic VAGO scores obtained on FreSaDa. Using explainability tools (LIME), we show the interest of this neural version for the enrichment of the lexicons of the symbolic version, and for the production of versions in other languages.
arxiv情報
著者 | Benjamin Icard,Vincent Claveau,Ghislain Atemezing,Paul Égré |
発行日 | 2023-09-12 11:18:29+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google