AcTED: Automatic Acquisition of Typical Event Duration for Semi-supervised Temporal Commonsense QA

要約

我々は、イベントの典型的な期間を自動的に取得し、それを擬似ラベル付きデータとして使用する、投票駆動型の半教師ありアプローチを提案します。
人間による評価では、当社の擬似ラベルが驚くほど高い精度とバランスの取れた適用範囲を示していることが実証されています。
時間的常識 QA タスクでは、400 イベントの疑似サンプルのみを使用して、大量のトレーニング サンプルを必要とする既存の BERT ベースの弱教師ありアプローチに匹敵するパフォーマンスを達成できることが実験結果によって示されています。
RoBERTa ベースラインと比較すると、当社の最良のアプローチでは完全一致が 7% 向上し、最先端のパフォーマンスが確立されています。

要約(オリジナル)

We propose a voting-driven semi-supervised approach to automatically acquire the typical duration of an event and use it as pseudo-labeled data. The human evaluation demonstrates that our pseudo labels exhibit surprisingly high accuracy and balanced coverage. In the temporal commonsense QA task, experimental results show that using only pseudo examples of 400 events, we achieve performance comparable to the existing BERT-based weakly supervised approaches that require a significant amount of training examples. When compared to the RoBERTa baselines, our best approach establishes state-of-the-art performance with a 7% improvement in Exact Match.

arxiv情報

著者 Felix Virgo,Fei Cheng,Lis Kanashiro Pereira,Masayuki Asahara,Ichiro Kobayashi,Sadao Kurohashi
発行日 2024-03-27 12:33:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク