要約
この論文では、モンテカルロ木探索 (MCTS) を使用する強化学習アルゴリズムである文法強化学習 (GRL) と、文脈自由文法 (CFG) フレームワーク内でプッシュダウン オートマトン (PDA) をモデル化するトランスフォーマー アーキテクチャについて説明します。
ネットワーク分析、コンピューターサイエンス、生物学、社会科学における重要な課題である、グラフ内のパスとサイクルを効率的にカウントするという問題をユースケースとして取り上げ、GRL は、次の要素によって計算効率を向上させる、パス/サイクルカウントのための新しい行列ベースの式を発見しました。
最先端のアプローチに関する 2 ~ 6 件。
私たちの貢献には、(i) CFG 内で動作するグラフォーマーを生成するためのフレームワーク、(ii) 文法構造内の式を最適化するための GRL の開発、(iii) 重要な計算量の削減につながる、グラフ部分構造カウントのための新しい式の発見が含まれます。
改善。
要約(オリジナル)
This paper presents Grammar Reinforcement Learning (GRL), a reinforcement learning algorithm that uses Monte Carlo Tree Search (MCTS) and a transformer architecture that models a Pushdown Automaton (PDA) within a context-free grammar (CFG) framework. Taking as use case the problem of efficiently counting paths and cycles in graphs, a key challenge in network analysis, computer science, biology, and social sciences, GRL discovers new matrix-based formulas for path/cycle counting that improve computational efficiency by factors of two to six w.r.t state-of-the-art approaches. Our contributions include: (i) a framework for generating gramformers that operate within a CFG, (ii) the development of GRL for optimizing formulas within grammatical structures, and (iii) the discovery of novel formulas for graph substructure counting, leading to significant computational improvements.
arxiv情報
著者 | Jason Piquenot,Maxime Bérar,Pierre Héroux,Jean-Yves Ramel,Romain Raveaux,Sébastien Adam |
発行日 | 2024-10-02 15:29:42+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google