DiLogics: Creating Web Automation Programs With Diverse Logics


ナレッジ ワーカーは、レコードの更新や注文などの反復的な Web データ入力タスクに頻繁に遭遇します。
Web 自動化により生産性は向上しますが、タスクを Web アクションに正確に変換し、新しい仕様に拡張することは困難です。
既存のツールは、UI アクションの同じ論理トレース (各フィールドにテキストを順番に入力するなど) を実行するタスクを自動化できますが、さまざまな入力条件に基づいて異なる実行を必要とするタスクをサポートしていません。
多様な仕様に対応した Web 自動化プログラムの作成を支援する、NLP を利用したデモンストレーションによるプログラミング システム DiLogics を紹介します。
DiLogics は、まず入力データを構造化されたタスク ステップに意味的にセグメント化します。
各ステップのユーザー デモンストレーションを記録することで、DiLogics は Web マクロを新規だが意味的に類似したタスク要件に一般化します。
私たちの評価では、専門家でなくても DiLogic を効果的に使用して、多様な入力命令を満たす自動化プログラムを作成できることがわかりました。
DiLogics は、多様な仕様を満たす Web オートメーション プログラムを開発するための効率的、直観的、表現力豊かな方法を提供します。


Knowledge workers frequently encounter repetitive web data entry tasks, like updating records or placing orders. Web automation increases productivity, but translating tasks to web actions accurately and extending to new specifications is challenging. Existing tools can automate tasks that perform the same logical trace of UI actions (e.g., input text in each field in order), but do not support tasks requiring different executions based on varied input conditions. We present DiLogics, a programming-by-demonstration system that utilizes NLP to assist users in creating web automation programs that handle diverse specifications. DiLogics first semantically segments input data to structured task steps. By recording user demonstrations for each step, DiLogics generalizes the web macros to novel but semantically similar task requirements. Our evaluation showed that non-experts can effectively use DiLogics to create automation programs that fulfill diverse input instructions. DiLogics provides an efficient, intuitive, and expressive method for developing web automation programs satisfying diverse specifications.


著者 Kevin Pu,Jim Yang,Angel Yuan,Minyi Ma,Rui Dong,Xinyu Wang,Yan Chen,Tovi Grossman
発行日 2023-08-18 15:33:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.HC, cs.PL パーマリンク