Paraphrasing Techniques for Maritime QA system

要約

人工知能 (AI) を防衛および軍事システムに組み込み、人間の知性と能力を補完および強化することへの関心が高まっています。
ただし、効果的な人間と機械のパートナーシップを実現するためには、まだ多くの作業を行う必要があります。
この作業は、人間の自然言語を機械が理解できる言語 (SQL クエリなど) に自動的に翻訳する機能を開発することにより、人間と機械のコミュニケーションを強化することを目的としています。
通常、この目標を達成するための手法には、手動で注釈を付けた大量の高品質データでトレーニングされたセマンティック パーサーの構築が含まれます。
ただし、実際の防衛シナリオの多くでは、このような大量のトレーニング データを取得することは現実的ではありません。
私たちの知る限り、限られた手動で言い換えられたデータ、つまりゼロショットでセマンティックパーサーをトレーニングする可能性を探ろうとしている研究はほとんどありません。
このホワイト ペーパーでは、大規模なトレーニング データセット (言い換えられた発話とそれに対応する SQL 形式の論理形式の形式) を自動生成するための言い換え方法を活用する方法を調査し、海事の実世界のデータを使用した実験結果を提示します。
ドメイン。

要約(オリジナル)

There has been an increasing interest in incorporating Artificial Intelligence (AI) into Defence and military systems to complement and augment human intelligence and capabilities. However, much work still needs to be done toward achieving an effective human-machine partnership. This work is aimed at enhancing human-machine communications by developing a capability for automatically translating human natural language into a machine-understandable language (e.g., SQL queries). Techniques toward achieving this goal typically involve building a semantic parser trained on a very large amount of high-quality manually-annotated data. However, in many real-world Defence scenarios, it is not feasible to obtain such a large amount of training data. To the best of our knowledge, there are few works trying to explore the possibility of training a semantic parser with limited manually-paraphrased data, in other words, zero-shot. In this paper, we investigate how to exploit paraphrasing methods for the automated generation of large-scale training datasets (in the form of paraphrased utterances and their corresponding logical forms in SQL format) and present our experimental results using real-world data in the maritime domain.

arxiv情報

著者 Fatemeh Shiri,Terry Yue Zhuo,Zhuang Li,Van Nguyen,Shirui Pan,Weiqing Wang,Reza Haffari,Yuan-Fang Li
発行日 2023-03-09 11:08:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク