Imitation Learning Inputting Image Feature to Each Layer of Neural Network

要約

模倣学習により、ロボットはトレーニング データから人間の行動を学習し、再現できます。
最近の機械学習の進歩により、画像などの高次元の観測データを直接処理するエンドツーエンドの学習アプローチが可能になりました。
ただし、これらのアプローチは、複数のモダリティからのデータを処理する場合、特に短いサンプリング期間を使用する場合、目的の出力との相関が低いデータを誤って無視してしまうという重大な課題に直面します。
本稿では、この課題に対処するための有用な方法を紹介します。これは、データを各ニューラル ネットワーク層に入力することで、出力との相関が比較的低いデータの影響を増幅します。
提案されたアプローチは、多様なデータソースを学習プロセスに効果的に組み込んでいます。
生の画像と結合情報を入力として使用した単純なピックアンドプレイス操作を使用した実験により、短いサンプリング期間のデータを処理する場合でも成功率が大幅に向上することが実証されました。

要約(オリジナル)

Imitation learning enables robots to learn and replicate human behavior from training data. Recent advances in machine learning enable end-to-end learning approaches that directly process high-dimensional observation data, such as images. However, these approaches face a critical challenge when processing data from multiple modalities, inadvertently ignoring data with a lower correlation to the desired output, especially when using short sampling periods. This paper presents a useful method to address this challenge, which amplifies the influence of data with a relatively low correlation to the output by inputting the data into each neural network layer. The proposed approach effectively incorporates diverse data sources into the learning process. Through experiments using a simple pick-and-place operation with raw images and joint information as input, significant improvements in success rates are demonstrated even when dealing with data from short sampling periods.

arxiv情報

著者 Koki Yamane,Sho Sakaino,Toshiaki Tsuji
発行日 2024-01-18 02:44:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク