要約
タイトル:多言語意味解析のためのアクティブラーニング
要約:
– 現在の多言語意味解析(MSP)のデータセットは、リソースが豊富な言語からターゲット言語への既存のデータセットの発話を翻訳することで収集されています。
– しかし、手動翻訳は高価です。この論文は、MSPのための最初のアクティブラーニング手順(AL-MSP)を提案し、既存のデータセットの一部のみを翻訳するように選択します。
– また、より多様な論理形式構造とより多くの語彙選択を備えた例を優先的に選択する新しい選択方法と、追加の注釈コストが必要ない新しいハイパーパラメータ調整方法も提案します。
– 実験結果は、AL-MSPが適切な選択方法とともに翻訳コストを大幅に削減することを示しています。正しいハイパーパラメータを備えた選択方法は、2つの多言語データセットで他のベースラインよりも解析性能が高くなります。
要約(オリジナル)
Current multilingual semantic parsing (MSP) datasets are almost all collected by translating the utterances in the existing datasets from the resource-rich language to the target language. However, manual translation is costly. To reduce the translation effort, this paper proposes the first active learning procedure for MSP (AL-MSP). AL-MSP selects only a subset from the existing datasets to be translated. We also propose a novel selection method that prioritizes the examples diversifying the logical form structures with more lexical choices, and a novel hyperparameter tuning method that needs no extra annotation cost. Our experiments show that AL-MSP significantly reduces translation costs with ideal selection methods. Our selection method with proper hyperparameters yields better parsing performance than the other baselines on two multilingual datasets.
arxiv情報
著者 | Zhuang Li,Gholamreza Haffari |
発行日 | 2023-04-13 13:30:06+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI