Ontology Enhanced Claim Detection

要約

文ベースのクレーム検出のためのオントロジー強化モデルを提案します。
ナレッジ ベースからのオントロジーの埋め込みと BERT 文の埋め込みを融合して、ClaimBuster および NewsClaims データセットのクレーム検出を実行しました。
私たちのオントロジー強化アプローチは、他の統計モデルやニューラル機械学習モデルと比較して、これらの小規模で不均衡なデータセットで最良の結果を示しました。
この実験は、ドメイン固有の機能 (トレーニングされた単語埋め込みまたはナレッジ グラフ メタデータのいずれか) を追加すると、従来の ML 手法を改善できることを示しています。
さらに、オントロジー埋め込みの形でドメイン知識を追加すると、ニューラル ネットワーク ベースのモデルで発生するバイアス、たとえば、小さなコーパス内のより大きなクラスに対する純粋な BERT モデルのバイアスを回避するのに役立ちます。

要約(オリジナル)

We propose an ontology enhanced model for sentence based claim detection. We fused ontology embeddings from a knowledge base with BERT sentence embeddings to perform claim detection for the ClaimBuster and the NewsClaims datasets. Our ontology enhanced approach showed the best results with these small-sized unbalanced datasets, compared to other statistical and neural machine learning models. The experiments demonstrate that adding domain specific features (either trained word embeddings or knowledge graph metadata) can improve traditional ML methods. In addition, adding domain knowledge in the form of ontology embeddings helps avoid the bias encountered in neural network based models, for example the pure BERT model bias towards larger classes in our small corpus.

arxiv情報

著者 Zehra Melce Hüsünbeyi,Tatjana Scheffler
発行日 2024-02-19 16:50:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク