Improved Monte Carlo tree search formulation with multiple root nodes for discrete sizing optimization of truss structures

要約

本稿では、トラス構造の離散最適設計のための改良型モンテカルロ木探索(IMCTS)定式化を用いた新しい強化学習(RL)アルゴリズムを提案する。
複数のルートノードを持つ IMCTS には、更新プロセス、最高の報酬、加速テクニック、および終了条件が含まれます。
更新プロセスとは、最終解が見つかったら、それを次の検索ツリーの初期解として使用することを意味します。
最良の報酬は逆伝播ステップで使用されます。
高速化手法は、検索ツリーの幅を減らし、最大反復回数を減らすことによって導入されます。
エージェントは、最終条件が満たされるまで、さまざまな制約の下で総構造重量を最小化するようにトレーニングされます。
この場合、最適解は、探索ツリーによって見つかったすべての解の最小値になります。
これらの数値例は、エージェントが低計算コストで最適解を見つけ、安定して最適な設計を生成し、多目的構造最適化や大規模構造に適していることを示しています。

要約(オリジナル)

This paper proposes a novel reinforcement learning (RL) algorithm using improved Monte Carlo tree search (IMCTS) formulation for discrete optimum design of truss structures. IMCTS with multiple root nodes includes update process, the best reward, accelerating technique, and terminal condition. Update process means that once a final solution is found, it is used as the initial solution for next search tree. The best reward is used in the backpropagation step. Accelerating technique is introduced by decreasing the width of search tree and reducing maximum number of iterations. The agent is trained to minimize the total structural weight under various constraints until the terminal condition is satisfied. Then, optimal solution is the minimum value of all solutions found by search trees. These numerical examples show that the agent can find optimal solution with low computational cost, stably produces an optimal design, and is suitable for multi-objective structural optimization and large-scale structures.

arxiv情報

著者 Fu-Yao Ko,Katsuyuki Suzuki,Kazuo Yonekura
発行日 2024-08-07 13:29:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.NA, math.NA パーマリンク