ERTIM@MC2: Diversified Argumentative Tweets Retrieval




– ERTIM@MC2は、CLEF MC2 2018エディションで、英語とフランス語のいくつかの祭りに関する最も多様な論証的なツイートを検出することを目的としています。
– ツイートの論証性を測定するため、論点化した化合物が含まれているかどうかを計算します。
– つまり、意見表明とそれを支持する事実と特定の構造の組み合わせを論証化された化合物と見なします。
– 多様さに関して、ツイートがカバーする祭りの側面の量を考慮しています。
– 最初のステップでは、タスクの言語およびトピックの要件に合わせて元のデータセットをフィルタリングします。
– 次に、言語記述子を計算し統合して、ツイート内の主張とそれらの正当化を検出します。
– 最後のステップでは、テキストコンテンツに基づいてツイートをクラスタ化し、各クラスタから最も議論的なものを選択して、最も多様な論証を抽出します。
– この論文では、提出されたさまざまなランにおいて、記述子を組み合わせたさまざまな方法を説明し、その結果について議論しています。


In this paper, we present our participation to CLEF MC2 2018 edition for the task 2 Mining opinion argumentation. It consists in detecting the most argumentative and diverse Tweets about some festivals in English and French from a massive multilingual collection. We measure argumentativity of a Tweet computing the amount of argumentation compounds it contains. We consider argumentation compounds as a combination between opinion expression and its support with facts and a particular structuration. Regarding diversity, we consider the amount of festival aspects covered by Tweets. An initial step filters the original dataset to fit the language and topic requirements of the task. Then, we compute and integrate linguistic descriptors to detect claims and their respective justifications in Tweets. The final step extracts the most diverse arguments by clustering Tweets according to their textual content and selecting the most argumentative ones from each cluster. We conclude the paper describing the different ways we combined the descriptors among the different runs we submitted and discussing their results.


著者 Kévin Deturck,Parantapa Goswami,Damien Nouvel,Frédérique Segond
発行日 2023-04-17 08:06:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.CL パーマリンク