要約
偽のプログラムの問題は、弱い監視からセマンティック パーサーをトレーニングする際の長年の課題です。
意味論は間違っているが表記は正しいこのようなプログラムを排除するために、既存の方法は、ドメイン固有の知識に基づいて例間の類似性を利用することに重点を置いています。
本稿では、プログラムの実行結果に基づくドメインに依存しないフィルタリング機構を提案します。
具体的には、検索プロセスを通じて取得された各プログラムについて、まず、さまざまな入力の下での実行結果としてプログラムのセマンティクスをキャプチャする表現を構築します。
次に、これらの表現に対して多数決を実行し、他のプログラムとはセマンティクスが大きく異なるプログラムを特定し、除外します。
特に、私たちの方法はプログラム検索プロセスと直交しているため、既存の弱く監視された意味解析フレームワークを簡単に拡張できます。
Natural Language Visual Reasoning と WikiTableQuestions の経験的評価は、私たちの方法を既存のセマンティック パーサーに適用すると、パフォーマンスが大幅に向上することを示しています。
要約(オリジナル)
The problem of spurious programs is a longstanding challenge when training a semantic parser from weak supervision. To eliminate such programs that have wrong semantics but correct denotation, existing methods focus on exploiting similarities between examples based on domain-specific knowledge. In this paper, we propose a domain-agnostic filtering mechanism based on program execution results. Specifically, for each program obtained through the search process, we first construct a representation that captures the program’s semantics as execution results under various inputs. Then, we run a majority vote on these representations to identify and filter out programs with significantly different semantics from the other programs. In particular, our method is orthogonal to the program search process so that it can easily augment any of the existing weakly supervised semantic parsing frameworks. Empirical evaluations on the Natural Language Visual Reasoning and WikiTableQuestions demonstrate that applying our method to the existing semantic parsers induces significantly improved performances.
arxiv情報
著者 | Kang-il Lee,Segwang Kim,Kyomin Jung |
発行日 | 2023-11-02 11:45:40+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google