Learning Goal-based Movement via Motivational-based Models in Cognitive Mobile Robots

要約

人間には、強度と文脈に応じて行動を動機付ける必要があります。
ただし、時間の経過とともに変化しやすい、各アクションの知覚される喜びに関連する好みも作成します。
これにより、意思決定がより複雑になり、状況に応じてニーズと好みのバランスを取るための学習が必要になります。
このプロセスがどのように機能するかを理解し、動機ベースの学習モデルを備えたロボットの開発を可能にするために、Hull によって提案された動機理論を計算モデル化します。
このモデルでは、エージェント (モバイル ロボットを抽象化したもの) は、自身を恒常性の状態に保つよう動機づけられています。
嗜好が意思決定にどのように影響するかを確認するためにヘドニック ディメンションを追加し、強化学習を使用して動機ベースのエージェントをトレーニングしました。
2 つの異なる環境で異なる代謝を表すエネルギー減衰率を持つ 3 つのエージェントを実行して、それらの戦略、動き、行動への影響を確認します。
結果は、エージェントがその代謝に応じてより適切な選択を可能にする環境でより良い戦略を学習したことを示しています。
動機付けメカニズムにおける喜びの使用は、主に代謝の遅いエージェントの行動学習に大きな影響を与えました。
生存が危険にさらされている場合、エージェントは喜びと平衡を無視し、過酷なシナリオでどのように行動するかを示唆します.

要約(オリジナル)

Humans have needs motivating their behavior according to intensity and context. However, we also create preferences associated with each action’s perceived pleasure, which is susceptible to changes over time. This makes decision-making more complex, requiring learning to balance needs and preferences according to the context. To understand how this process works and enable the development of robots with a motivational-based learning model, we computationally model a motivation theory proposed by Hull. In this model, the agent (an abstraction of a mobile robot) is motivated to keep itself in a state of homeostasis. We added hedonic dimensions to see how preferences affect decision-making, and we employed reinforcement learning to train our motivated-based agents. We run three agents with energy decay rates representing different metabolisms in two different environments to see the impact on their strategy, movement, and behavior. The results show that the agent learned better strategies in the environment that enables choices more adequate according to its metabolism. The use of pleasure in the motivational mechanism significantly impacted behavior learning, mainly for slow metabolism agents. When survival is at risk, the agent ignores pleasure and equilibrium, hinting at how to behave in harsh scenarios.

arxiv情報

著者 Letícia Berto,Paula Costa,Alexandre Simões,Ricardo Gudwin,Esther Colombini
発行日 2023-02-20 04:52:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク