Auto-Formula: Recommend Formulas in Spreadsheets using Contrastive Learning for Table Representations

要約

スプレッドシートは、数式ベースの計算能力と直感的なテーブルベースのインターフェイスを組み合わせた、最も人気のあるエンドユーザー プログラミング ツールとして広く認識されています。
現在、スプレッドシートはテーブルを操作するために何十億ものユーザーによって使用されていますが、そのほとんどはデータベースの専門家でもプロのプログラマーでもありません。
スプレッドシートの成功にもかかわらず、技術者以外のユーザーは簡単ではない数式構文を調べて理解する必要があるため、複雑な数式を作成することは依然として困難です。
この問題点に対処するために、同じ組織内に似たようなスプレッドシートが大量に存在することが多く、それらのスプレッドシートには似たようなデータがあるだけでなく、数式としてエンコードされた同様の計算ロジックも共有しているという観察結果を活用します。
私たちは、コンピューティングからの「類似顔認識」に触発された対照学習技術を使用して、同様のスプレッドシートにすでに存在する数式を学習して適応させることにより、ユーザーがターゲットのスプレッドシート セルに作成したい数式を正確に予測できる自動数式システムを開発します。
ビジョン。
実際のエンタープライズ スプレッドシートから抽出された 2,000 を超えるテスト式に対する広範な評価により、自動式が代替手段よりも有効であることが示されています。
今後の研究を促進するために、ベンチマーク データは https://github.com/microsoft/Auto-Formula で入手できます。

要約(オリジナル)

Spreadsheets are widely recognized as the most popular end-user programming tools, which blend the power of formula-based computation, with an intuitive table-based interface. Today, spreadsheets are used by billions of users to manipulate tables, most of whom are neither database experts nor professional programmers. Despite the success of spreadsheets, authoring complex formulas remains challenging, as non-technical users need to look up and understand non-trivial formula syntax. To address this pain point, we leverage the observation that there is often an abundance of similar-looking spreadsheets in the same organization, which not only have similar data, but also share similar computation logic encoded as formulas. We develop an Auto-Formula system that can accurately predict formulas that users want to author in a target spreadsheet cell, by learning and adapting formulas that already exist in similar spreadsheets, using contrastive-learning techniques inspired by ‘similar-face recognition’ from compute vision. Extensive evaluations on over 2K test formulas extracted from real enterprise spreadsheets show the effectiveness of Auto-Formula over alternatives. Our benchmark data is available at https://github.com/microsoft/Auto-Formula to facilitate future research.

arxiv情報

著者 Sibei Chen,Yeye He,Weiwei Cui,Ju Fan,Song Ge,Haidong Zhang,Dongmei Zhang,Surajit Chaudhuri
発行日 2024-04-19 03:28:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.DB, cs.PL パーマリンク