DQNC2S: DQN-based Cross-stream Crisis event Summarizer

要約

既存の取得と再ランキング戦略では、マルチストリーム データの固有の冗長性とマルチクエリ設定でのスケーラビリティの制限に悩まされるため、複数の災害関連データ ストリームを同時に要約することは特に困難です。
この研究では、Deep Q-Networks による弱いアノテーションに基づいて危機タイムラインを生成するオンライン アプローチを提案しています。
人間による注釈やコンテンツの再ランク付けを必要とせずに、テキストの関連する部分をオンザフライで選択します。
これにより、推論時間が入力クエリの数に依存しなくなります。
提案されたアプローチでは、ストリーム間のコンテンツの重複を効果的に処理するために、報酬関数に冗長フィルターも組み込まれています。
達成された ROUGE および BERTScore の結果は、CrisisFACTS 2022 ベンチマークで最もパフォーマンスの高いモデルの結果よりも優れています。

要約(オリジナル)

Summarizing multiple disaster-relevant data streams simultaneously is particularly challenging as existing Retrieve&Re-ranking strategies suffer from the inherent redundancy of multi-stream data and limited scalability in a multi-query setting. This work proposes an online approach to crisis timeline generation based on weak annotation with Deep Q-Networks. It selects on-the-fly the relevant pieces of text without requiring neither human annotations nor content re-ranking. This makes the inference time independent of the number of input queries. The proposed approach also incorporates a redundancy filter into the reward function to effectively handle cross-stream content overlaps. The achieved ROUGE and BERTScore results are superior to those of best-performing models on the CrisisFACTS 2022 benchmark.

arxiv情報

著者 Daniele Rege Cambrin,Luca Cagliero,Paolo Garza
発行日 2024-01-12 16:43:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.IR, cs.LG パーマリンク