A Reinforcement Learning-assisted Genetic Programming Algorithm for Team Formation Problem Considering Person-Job Matching




– チーム編成問題には、人材のスキルやチームメンバー間のコミュニケーションなど、さまざまな要素がある。
– 本論文では、人材-仕事マッチングを考慮したチーム編成問題(TFP-PJM)を解決するために、0-1整数プログラミングモデルを構築する。
– そのモデルは、人材-仕事マッチングスコアを判断するために直感的なファジィ数値を使用し、チームメンバー間のコミュニケーション意欲を考慮する。
– さらに、強化学習支援遺伝的プログラミングアルゴリズム(RL-GP)を提案し、ソリューションの品質を向上させる。
– RL-GPはアンサンブルポピュレーションの戦略を採用し、エージェントが取得した情報に応じて4つのポピュレーションサーチモードから選択することで、探索と利用のバランスを実現している。
– さらに、代理モデルを使用して個々が生成した編成計画を評価するために、アルゴリズムに代理モデルが導入され、アルゴリズムの学習プロセスが迅速化される。
– 次に、一連の比較実験を実施して、RL-GPの全体的な性能とアルゴリズム内の改善戦略の有効性を検証する。
– ハイパーヒューリスティックルールは、プロジェクトチーム形成時の意思決定支援として活用できる。
– 本研究は、強化学習手法、アンサンブル戦略、および遺伝的プログラミングフレームワークに適用された代理モデルの利点を明らかにし、RL-GPが実世界での企業環境に展開可能であることを示している。


An efficient team is essential for the company to successfully complete new projects. To solve the team formation problem considering person-job matching (TFP-PJM), a 0-1 integer programming model is constructed, which considers both person-job matching and team members’ willingness to communicate on team efficiency, with the person-job matching score calculated using intuitionistic fuzzy numbers. Then, a reinforcement learning-assisted genetic programming algorithm (RL-GP) is proposed to enhance the quality of solutions. The RL-GP adopts the ensemble population strategies. Before the population evolution at each generation, the agent selects one from four population search modes according to the information obtained, thus realizing a sound balance of exploration and exploitation. In addition, surrogate models are used in the algorithm to evaluate the formation plans generated by individuals, which speeds up the algorithm learning process. Afterward, a series of comparison experiments are conducted to verify the overall performance of RL-GP and the effectiveness of the improved strategies within the algorithm. The hyper-heuristic rules obtained through efficient learning can be utilized as decision-making aids when forming project teams. This study reveals the advantages of reinforcement learning methods, ensemble strategies, and the surrogate model applied to the GP framework. The diversity and intelligent selection of search patterns along with fast adaptation evaluation, are distinct features that enable RL-GP to be deployed in real-world enterprise environments.


著者 Yangyang Guo,Hao Wang,Lei He,Witold Pedrycz,P. N. Suganthan,Yanjie Song
発行日 2023-04-08 14:32:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.LG, cs.NE パーマリンク