要約
オンライン ユーザー間の会話は時々脱線します。つまり、個人攻撃に発展します。
このような脱線は、サイバースペース コミュニティの健全な成長に悪影響を及ぼします。
進行中の会話が脱線する可能性があるかどうかを予測する機能は、対話者やモデレーターに貴重なリアルタイムの洞察を提供する可能性があります.
従来のアプローチでは、会話の脱線を遡及的に予測し、脱線を積極的に未然に防ぐことができませんでした。
一部の作品は、会話が展開するにつれて動的な予測を試みますが、会話の構造や脱線までの距離などのマルチソース情報を組み込むことができません。
発話レベルと会話レベルの情報を組み合わせて、きめの細かい文脈上のセマンティクスをキャプチャする、階層的なトランスフォーマーベースのフレームワークを提案します。
会話構造情報を統合するためのドメイン適応型事前トレーニング目標と、各発話から脱線までの距離を活用するためのマルチタスク学習スキームを提案します。
2 つの会話脱線データセットに対するフレームワークの評価では、脱線の予測に関して F1 スコアよりも改善されています。
これらの結果は、マルチソース情報を組み込むことの有効性を示しています。
要約(オリジナル)
Conversations among online users sometimes derail, i.e., break down into personal attacks. Such derailment has a negative impact on the healthy growth of cyberspace communities. The ability to predict whether ongoing conversations are likely to derail could provide valuable real-time insight to interlocutors and moderators. Prior approaches predict conversation derailment retrospectively without the ability to forestall the derailment proactively. Some works attempt to make dynamic prediction as the conversation develops, but fail to incorporate multisource information, such as conversation structure and distance to derailment. We propose a hierarchical transformer-based framework that combines utterance-level and conversation-level information to capture fine-grained contextual semantics. We propose a domain-adaptive pretraining objective to integrate conversational structure information and a multitask learning scheme to leverage the distance from each utterance to derailment. An evaluation of our framework on two conversation derailment datasets yields improvement over F1 score for the prediction of derailment. These results demonstrate the effectiveness of incorporating multisource information.
arxiv情報
著者 | Jiaqing Yuan,Munindar P. Singh |
発行日 | 2023-03-20 15:10:45+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google