Let the Flows Tell: Solving Graph Combinatorial Optimization Problems with GFlowNets

要約

組み合わせ最適化 (CO) 問題は、多くの場合 NP 困難であるため、正確なアルゴリズムが適用できないため、機械学習手法を適用するのが魅力的な領域となっています。
これらの問題における高度に構造化された制約は、解空間での最適化やサンプリングを直接妨げる可能性があります。
一方、GFlowNets は、複合非正規化密度から効率的に順次サンプリングする強力な機構として最近登場しており、そのような解探索プロセスを CO で償却し、多様な解候補を生成する可能性があります。
この論文では、さまざまな組み合わせ問題に対してマルコフ決定プロセス (MDP) を設計し、解空間からサンプリングするために条件付き GFlowNet をトレーニングすることを提案します。
長期にわたる単位の割り当てに役立つ、効率的なトレーニング手法も開発されています。
合成データと現実的なデータを使用したさまざまな CO タスクに関する広範な実験を通じて、GFlowNet ポリシーが高品質のソリューションを効率的に見つけられることを実証しました。
私たちの実装は https://github.com/zdhNarsil/GFlowNet-CombOpt でオープンソース化されています。

要約(オリジナル)

Combinatorial optimization (CO) problems are often NP-hard and thus out of reach for exact algorithms, making them a tempting domain to apply machine learning methods. The highly structured constraints in these problems can hinder either optimization or sampling directly in the solution space. On the other hand, GFlowNets have recently emerged as a powerful machinery to efficiently sample from composite unnormalized densities sequentially and have the potential to amortize such solution-searching processes in CO, as well as generate diverse solution candidates. In this paper, we design Markov decision processes (MDPs) for different combinatorial problems and propose to train conditional GFlowNets to sample from the solution space. Efficient training techniques are also developed to benefit long-range credit assignment. Through extensive experiments on a variety of different CO tasks with synthetic and realistic data, we demonstrate that GFlowNet policies can efficiently find high-quality solutions. Our implementation is open-sourced at https://github.com/zdhNarsil/GFlowNet-CombOpt.

arxiv情報

著者 Dinghuai Zhang,Hanjun Dai,Nikolay Malkin,Aaron Courville,Yoshua Bengio,Ling Pan
発行日 2023-11-20 16:57:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DM, cs.LG, stat.ML パーマリンク