Multi-Hop Table Retrieval for Open-Domain Text-to-SQL

要約

オープンドメインの text-to-SQL は、大規模なデータベースから質問に関連するテーブルを取得して SQL を生成する重要なタスクです。
ただし、単一ホップで取得する既存の取得方法は、テキストから SQL へのスキーマ リンクの課題に注意を払っていません。これは、質問内のエンティティをテーブル エンティティと位置合わせすることであり、類似した無関係なエンティティとドメインの不一致という 2 つの側面に反映されています。
実在物。
そこで、我々は、書き換えとビームサーチを伴うマルチホップテーブル検索(Murre)という手法を提案する。
同様の無関係なエンティティの影響を軽減するために、私たちの方法は各ホップで未取得のエンティティに焦点を当て、ビーム検索によって低ランクのテーブルを考慮します。
ドメイン不一致エンティティの制限を軽減するために、Murre は複数のホップで取得したテーブルに基づいて質問を書き直し、関連するテーブルとのドメイン ギャップを減らします。
SpiderUnion と BirdUnion+ で実験を実施し、平均 6.38% の改善という新しい最先端の結果に達しました。

要約(オリジナル)

Open-domain text-to-SQL is an important task that retrieves question-relevant tables from massive databases and then generates SQL. However, existing retrieval methods that retrieve in a single hop do not pay attention to the text-to-SQL challenge of schema linking, which is aligning the entities in the question with table entities, reflected in two aspects: similar irrelevant entity and domain mismatch entity. Therefore, we propose our method, the multi-hop table retrieval with rewrite and beam search (Murre). To reduce the effect of the similar irrelevant entity, our method focuses on unretrieved entities at each hop and considers the low-ranked tables by beam search. To alleviate the limitation of domain mismatch entity, Murre rewrites the question based on retrieved tables in multiple hops, decreasing the domain gap with relevant tables. We conduct experiments on SpiderUnion and BirdUnion+, reaching new state-of-the-art results with an average improvement of 6.38%.

arxiv情報

著者 Xuanliang Zhang,Dingzirui Wang,Longxu Dou,Qingfu Zhu,Wanxiang Che
発行日 2024-08-16 15:37:25+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク