要約
あいまいさと特別な除外の処理は、特にテキストからSQLのセマンティック解析などのタスクでは、自然言語界面において重要な課題です。
これらを論理フォーム(SQLクエリなど)にマッピングする前に、自然言語解釈を使用して曖昧さを解決するモジュラーアプローチを提案します。
LLMSは明確な発話を解析することに優れていますが、それらは曖昧なものに対して強いバイアスを示し、通常は好ましい解釈のみを予測します。
このバイアスを建設的に活用して、初期の優先除去セットを生成し、特殊な充填モデルを適用して、欠落している解釈を特定して生成します。
充填モデルをトレーニングするために、SQL実行を使用してさまざまな意味を検証する注釈方法を紹介します。
私たちのアプローチは、解釈のカバレッジを改善し、さまざまな注釈スタイル、データベース構造、あいまいさの種類を備えたデータセット間で一般化します。
要約(オリジナル)
Handling ambiguity and underspecification is an important challenge in natural language interfaces, particularly for tasks like text-to-SQL semantic parsing. We propose a modular approach that resolves ambiguity using natural language interpretations before mapping these to logical forms (e.g., SQL queries). Although LLMs excel at parsing unambiguous utterances, they show strong biases for ambiguous ones, typically predicting only preferred interpretations. We constructively exploit this bias to generate an initial set of preferred disambiguations and then apply a specialized infilling model to identify and generate missing interpretations. To train the infilling model, we introduce an annotation method that uses SQL execution to validate different meanings. Our approach improves interpretation coverage and generalizes across datasets with different annotation styles, database structures, and ambiguity types.
arxiv情報
著者 | Irina Saparina,Mirella Lapata |
発行日 | 2025-02-25 18:42:26+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google