Deep Learning for Mean Field Optimal Transport

要約

平均場制御 (MFC) 問題は、戦略的エージェントの非常に大きな集団における社会的最適を研究するために導入されました。
主なアイデアは、無限の人口を考慮し、平均場近似を使用して分析を簡素化することです。
これらの問題は、McKean-Vlasov ダイナミクスの最適制御問題と見なすこともできます。
それらは、経済や金融から社会科学や工学まで、幅広い分野で応用されています。
通常、エージェントの目標は、ランニング コストとターミナル コストを合わせた総コストを最小化することです。
この作業では、端末コストがなく、代わりに端末分布が規定されている MFC 問題を考えます。
このような問題は、平均場相互作用がダイナミクスまたはランニング コスト関数で発生する場合、古典的な最適輸送問題の一般化と見なすことができるため、平均場最適輸送問題と呼ばれます。
ニューラル ネットワークに基づく 3 つの数値的手法を提案します。
最初のものは、最適な制御を直接学習することに基づいています。
2 つ目は、解を特徴付ける前後偏微分方程式系を解くことになります。
3 つ目は、主双対アプローチに依存しています。
例の 2 つのファミリで実行される数値実験でこれらの方法を説明します。

要約(オリジナル)

Mean field control (MFC) problems have been introduced to study social optima in very large populations of strategic agents. The main idea is to consider an infinite population and to simplify the analysis by using a mean field approximation. These problems can also be viewed as optimal control problems for McKean-Vlasov dynamics. They have found applications in a wide range of fields, from economics and finance to social sciences and engineering. Usually, the goal for the agents is to minimize a total cost which consists in the integral of a running cost plus a terminal cost. In this work, we consider MFC problems in which there is no terminal cost but, instead, the terminal distribution is prescribed. We call such problems mean field optimal transport problems since they can be viewed as a generalization of classical optimal transport problems when mean field interactions occur in the dynamics or the running cost function. We propose three numerical methods based on neural networks. The first one is based on directly learning an optimal control. The second one amounts to solve a forward-backward PDE system characterizing the solution. The third one relies on a primal-dual approach. We illustrate these methods with numerical experiments conducted on two families of examples.

arxiv情報

著者 Sebastian Baudelet,Brieuc Frénais,Mathieu Laurière,Amal Machtalay,Yuchen Zhu
発行日 2023-02-28 16:41:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, math.OC パーマリンク