Cross-Genre Argument Mining: Can Language Models Automatically Fill in Missing Discourse Markers?

要約

議論マイニングに利用できるコーパスはいくつかの軸に沿って異なりますが、主な違いの 1 つは議論の内容を示す談話マーカーの有無です。
談話マーカーを使用する効果的な方法の探求は、さまざまな談話解析タスクにおいて広く注目を集めており、そこから談話マーカーが談話関係の強力な指標であることはよく知られています。
さまざまなジャンルにわたる議論マイニング システムの堅牢性を向上させるために、すべての関係が明示的に通知されるように、特定のテキストを談話マーカーで自動的に強化することを提案します。
私たちの分析により、そのまま使用した一般的な言語モデルはこのタスクに失敗していることが明らかになりました。
ただし、構築した新しい異種データセット (合成例と実際の例を含む) で微調整すると、パフォーマンスが大幅に向上します。
私たちは、さまざまなコーパスで評価された引数マイニングの下流タスクに対するアプローチの影響を実証し、さまざまなコーパスにわたる談話マーカーを自動的に埋めるように言語モデルをトレーニングできることを示し、すべてではなく一部の下流モデルのパフォーマンスを向上させます。
ケース。
私たちが提案したアプローチは、談話をよりよく理解するための補助ツールとしてさらに使用できます。

要約(オリジナル)

Available corpora for Argument Mining differ along several axes, and one of the key differences is the presence (or absence) of discourse markers to signal argumentative content. Exploring effective ways to use discourse markers has received wide attention in various discourse parsing tasks, from which it is well-known that discourse markers are strong indicators of discourse relations. To improve the robustness of Argument Mining systems across different genres, we propose to automatically augment a given text with discourse markers such that all relations are explicitly signaled. Our analysis unveils that popular language models taken out-of-the-box fail on this task; however, when fine-tuned on a new heterogeneous dataset that we construct (including synthetic and real examples), they perform considerably better. We demonstrate the impact of our approach on an Argument Mining downstream task, evaluated on different corpora, showing that language models can be trained to automatically fill in discourse markers across different corpora, improving the performance of a downstream model in some, but not all, cases. Our proposed approach can further be employed as an assistive tool for better discourse understanding.

arxiv情報

著者 Gil Rocha,Henrique Lopes Cardoso,Jonas Belouadi,Steffen Eger
発行日 2023-06-07 10:19:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク