Matching Tasks with Industry Groups for Augmenting Commonsense Knowledge

要約

常識的な知識ベース(KB)は、機械学習アプリケーションを改善するために広く使用されている専門知識の源です。
ただし、コンセプトネットなどの大規模なKBでさえ、各業界ドメインから明示的な知識をキャプチャすることは困難です。
たとえば、さまざまな業界で実行される一般的な{\ emタスク}のサンプルは、コンセプトで利用できます。
ここで、タスクは、特定の目標を達成するための明確に定義された知識に基づいた意欲的な行動です。
この論文では、このギャップを埋めることを目指し、さまざまな業界グループ(IG)が実施したタスクを使用して、成熟したKBを増強するために、弱く監視されたフレームワークを提示することを目指しています。
Neural Modelをトレーニングすることにより、1つ以上の適切なIGを使用して各タスクを{\ em mate} {\ em mate}を試みます。Task-IG Affinityを学び、クラスタリングを適用してIGあたりのTOP-Kタスクを選択します。
$ \ langle igの合計2339トリプルを抽出します。
これにより、既存のKBSに直接追加できる抽出されたタスク-IGペアの信頼性が検証されます。

要約(オリジナル)

Commonsense knowledge bases (KB) are a source of specialized knowledge that is widely used to improve machine learning applications. However, even for a large KB such as ConceptNet, capturing explicit knowledge from each industry domain is challenging. For example, only a few samples of general {\em tasks} performed by various industries are available in ConceptNet. Here, a task is a well-defined knowledge-based volitional action to achieve a particular goal. In this paper, we aim to fill this gap and present a weakly-supervised framework to augment commonsense KB with tasks carried out by various industry groups (IG). We attempt to {\em match} each task with one or more suitable IGs by training a neural model to learn task-IG affinity and apply clustering to select the top-k tasks per IG. We extract a total of 2339 triples of the form $\langle IG, is~capable~of, task \rangle$ from two publicly available news datasets for 24 IGs with the precision of 0.86. This validates the reliability of the extracted task-IG pairs that can be directly added to existing KBs.

arxiv情報

著者 Rituraj Singh,Sachin Pawar,Girish Palshikar
発行日 2025-05-12 11:02:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク