Shaping Multi-Robot Patrol Performance with Heterogeneity in Individual Learning Behavior

要約

人間であれ、他の動物であれ、ロボットであれ、社会集団内での学習行動における個体差は、集団的な課題遂行に大きな影響を及ぼす可能性がある。環境に対する個体の反応や、個体同士の相互作用に影響を与える可能性があるからだ。近年、学習やその他の特性における個体差が、集団の成果にどのような影響を与えるかという問題に対する関心が高まっている。例えば、社会的昆虫の採餌行動において研究されている。ここでは、潜在的抑制(LI)と呼ばれる学習行動における不均一性が、環境監視や異常検知を任務とするパトロールロボットのチームにとって有用かどうかを検討する。潜在的抑制(LI)が高い個体は、無関係な刺激や報酬の得られない刺激に対して不注意であることを学習する能力が高いと見ることができ、一方、LIが低い個体は「注意散漫」でありながら、より積極的に探索的であると見ることができるかもしれない。我々は、LIの効果を、以前報酬が得られなかった(無関係であった)場所を再度探索する確率(異常な読み)として単純なモデルを導入する。模擬パトロールにおいて、ほとんどが高LIロボットで構成され、低LIロボットは1台だけという負の偏りを持つ分布が、ダイナミックな環境の監視に最も効果的であることがわかった。これらの結果は「群工学」における「機能的不均一性」の一例であり、社会集団内の学習特性の生態学的分布の予測に役立つ可能性がある。

要約(オリジナル)

Individual differences in learning behavior within social groups, whether in humans, other animals, or among robots, can have significant effects on collective task performance. This is because it can affect individuals’ response to the environment and their interactions with each other. In recent years there has been rising interest in the question of how individual differences, whether in learning or other traits, affect collective outcomes: studied, for example, in social insect foraging behavior. Multi-robot, ‘swarm’ systems have a heritage of bioinspiration from such examples, and here we consider whether heterogeneity in a learning behavior called latent inhibition (LI) may be useful for a team of patrolling robots tasked with environmental monitoring and anomaly detection. Individuals with high LI can be seen as better at learning to be inattentive to irrelevant or unrewarding stimuli, while low LI individuals might be seen as ‘distractible’ and yet, more positively, more exploratory. We introduce a simple model of the effects of LI as the probability of re-searching a location for a reward (anomalous reading) where it has previously been found to be unrewarding (irrelevant). In simulated patrols, we find that a negatively skewed distribution of mostly high LI robots, and just a single low LI robot, is collectively most effective at monitoring dynamic environments. These results are an example of ‘functional heterogeneity’ in ‘swarm engineering’ and could inform predictions for ecological distributions of learning traits within social groups.

arxiv情報

著者 Connor York,Zachary R Madin,Paul O’Dowd,Edmund R Hunt
発行日 2024-03-02 11:29:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.RO パーマリンク