A Scalable Space-efficient In-database Interpretability Framework for Embedding-based Semantic SQL Queries

要約

AI 搭載データベース (AI-DB) は、自己監視型ニューラル ネットワーク (データベース埋め込み) を使用して、リレーショナル テーブルに対するセマンティック SQL クエリを有効にする、新しいリレーショナル データベース システムです。
このホワイト ペーパーでは、AI-DB でサポートされているセマンティック SQL クエリのランク付けされた結果に、シンプルで透過的で関連性のある洞察を提供するように設計された、データベース内の解釈可能性インフラストラクチャのアーキテクチャと実装について説明します。
リレーショナル エンティティ間の関係をキャプチャする新しい共起ベースの解釈可能性アプローチを導入し、共起カウントを保存および処理するためのスペース効率の高い確率的 Sketch 実装について説明します。
私たちのアプローチは、クエリに依存しない (グローバル) 解釈可能性とクエリ固有 (ローカル) 解釈可能性の両方を提供します。
実験的評価では、データベース内の確率論的アプローチが、ユーザーの介入なしで、スケーラブルでスペース効率の高いランタイム動作 (最大 8 倍のスペース節約) を提供しながら、正確なスペース効率の低いアプローチと同じ解釈可能性の品質を提供することが実証されています。

要約(オリジナル)

AI-Powered database (AI-DB) is a novel relational database system that uses a self-supervised neural network, database embedding, to enable semantic SQL queries on relational tables. In this paper, we describe an architecture and implementation of in-database interpretability infrastructure designed to provide simple, transparent, and relatable insights into ranked results of semantic SQL queries supported by AI-DB. We introduce a new co-occurrence based interpretability approach to capture relationships between relational entities and describe a space-efficient probabilistic Sketch implementation to store and process co-occurrence counts. Our approach provides both query-agnostic (global) and query-specific (local) interpretabilities. Experimental evaluation demonstrate that our in-database probabilistic approach provides the same interpretability quality as the precise space-inefficient approach, while providing scalable and space efficient runtime behavior (up to 8X space savings), without any user intervention.

arxiv情報

著者 Prabhakar Kudva,Rajesh Bordawekar,Apoorva Nitsure
発行日 2023-02-23 17:18:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク