要約
逐次意思決定(SDM)の分野では、歴史的に2つのパラダイムが覇権を争ってきた:自動プランニング(AP)と強化学習(RL)である。和解の精神に基づき、本稿では、逐次決定過程(SDP)を解くためのAP、RL、およびハイブリッド手法(新しい学習計画手法など)について、知識表現(記号的、サブ記号的、またはその組み合わせ)に焦点を当ててレビューする。さらに、SDPの構造を学習する手法も取り上げる。最後に、既存の手法の長所と短所を比較し、ニューロシンボリックAIは、APとRLをハイブリッドな知識表現で組み合わせたものであるため、SDMにとって有望なアプローチであると結論付ける。
要約(オリジナル)
In the field of Sequential Decision Making (SDM), two paradigms have historically vied for supremacy: Automated Planning (AP) and Reinforcement Learning (RL). In the spirit of reconciliation, this article reviews AP, RL and hybrid methods (e.g., novel learn to plan techniques) for solving Sequential Decision Processes (SDPs), focusing on their knowledge representation: symbolic, subsymbolic, or a combination. Additionally, it also covers methods for learning the SDP structure. Finally, we compare the advantages and drawbacks of the existing methods and conclude that neurosymbolic AI poses a promising approach for SDM, since it combines AP and RL with a hybrid knowledge representation.
arxiv情報
著者 | Carlos Núñez-Molina,Pablo Mesejo,Juan Fernández-Olivares |
発行日 | 2024-07-05 17:10:02+00:00 |
arxivサイト | arxiv_id(pdf) |