要約
倉庫ロボット工学の分野は現在需要が高く、大手テクノロジー企業や物流企業がこれらの先進的なシステムに多額の投資を行っています。
このような複雑な環境で動作するようにロボットを訓練するのは困難であり、多くの場合、適応と学習のために人間の監督が必要です。
インタラクティブ強化学習 (IRL) は、人間とコンピューターの対話における重要なトレーニング方法論です。
この論文では、仮想グリッド シミュレーション ベースの倉庫環境でトレーニングされた Q ラーニングと SARSA という 2 つの IRL アルゴリズムの比較研究を示します。
一貫したフィードバック報酬を維持し、バイアスを回避するために、研究全体を通じて同じ個人によってフィードバックが提供されました。
要約(オリジナル)
The field of warehouse robotics is currently in high demand, with major technology and logistics companies making significant investments in these advanced systems. Training robots to operate in such complex environments is challenging, often requiring human supervision for adaptation and learning. Interactive reinforcement learning (IRL) is a key training methodology in human-computer interaction. This paper presents a comparative study of two IRL algorithms: Q-learning and SARSA, both trained in a virtual grid-simulation-based warehouse environment. To maintain consistent feedback rewards and avoid bias, feedback was provided by the same individual throughout the study.
arxiv情報
著者 | Arunabh Bora |
発行日 | 2024-07-16 12:41:49+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google