ReGAL: Refactoring Programs to Discover Generalizable Abstractions

要約

大規模言語モデル (LLM) はプログラム合成にますます使用されていますが、有用な抽象化を開発するために必要なグローバルな視点が欠けています。
通常、プログラムは一度に 1 つずつ予測され、同じ機能を繰り返すことがよくあります。
冗長コードを最初から生成することは非効率的であり、エラーが発生しやすくなります。
これに対処するために、私たちは一般化可能な抽象化学習のためのリファクタリング (ReGAL) を提案します。これは、コードのリファクタライゼーション、つまり、実行出力を変更せずにコードを再構築することによって、再利用可能な関数のライブラリを学習する勾配のない方法です。
ReGAL は、既存のプログラムの小さなセットから学習し、実行を通じてその抽象化を繰り返し検証し、洗練させます。
ReGAL によって発見された共有関数ライブラリにより、さまざまなドメインにわたってプログラムの予測が容易になることがわかりました。
ロゴ グラフィック生成、日付推論、TextCraft (Minecraft ベースのテキスト ゲーム) MATH、TabMWP の 5 つのデータセットでは、オープンソース LLM と独自の LLM の両方で、ReGAL 関数を使用してプログラムを予測する際の精度が向上しました。
CodeLlama-13B の場合、ReGAL は、LOGO で 11.5%、日付理解で 26.1%、TextCraft で 8.1% の絶対精度の向上をもたらし、3 つのドメインのうち 2 つで GPT-3.5 を上回りました。
私たちの分析により、ReGAL の抽象化には、頻繁に使用されるサブルーチンと環境ダイナミクスがカプセル化されていることが明らかになりました。

要約(オリジナル)

While large language models (LLMs) are increasingly being used for program synthesis, they lack the global view needed to develop useful abstractions; they generally predict programs one at a time, often repeating the same functionality. Generating redundant code from scratch is both inefficient and error-prone. To address this, we propose Refactoring for Generalizable Abstraction Learning (ReGAL), a gradient-free method for learning a library of reusable functions via code refactorization, i.e., restructuring code without changing its execution output. ReGAL learns from a small set of existing programs, iteratively verifying and refining its abstractions via execution. We find that the shared function libraries discovered by ReGAL make programs easier to predict across diverse domains. On five datasets — LOGO graphics generation, Date reasoning, TextCraft (a Minecraft-based text-game) MATH, and TabMWP — both open-source and proprietary LLMs improve in accuracy when predicting programs with ReGAL functions. For CodeLlama-13B, ReGAL results in absolute accuracy increases of 11.5% on LOGO, 26.1% on date understanding, and 8.1% on TextCraft, outperforming GPT-3.5 in two of three domains. Our analysis reveals ReGAL’s abstractions encapsulate frequently-used subroutines as well as environment dynamics.

arxiv情報

著者 Elias Stengel-Eskin,Archiki Prasad,Mohit Bansal
発行日 2024-06-06 17:31:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG, cs.PL, cs.SE パーマリンク