要約
ロボット工学が進歩し続けるにつれて、特に支援ロボット工学の分野では、適応的で継続的に学習する身体化エージェントの必要性が高まっています。
人間の日常生活に典型的な動的な環境で動作するには、迅速な適応性と長期的な情報保持が不可欠です。
したがって、生涯にわたる学習パラダイムが必要とされていますが、現在のロボット工学の文献ではほとんど取り上げられていません。
この研究は、壊滅的な忘却の影響と、具体化された環境で継続的に訓練されたニューラルネットワークにおける知識伝達の有効性を実証的に調査しています。
私たちは、視覚的なオドメトリのタスクに焦点を当てます。これは、身体化されたエージェントにとって、自己位置特定を可能にする上で最も重要です。
私たちは、ロボットがさまざまなアパートを移動するのと同様に、屋内の場所間を個別に遷移する単純な継続的なシナリオを実験します。
この体制では、環境間で高い移行性を備えた初期の満足のいくパフォーマンスが観察され、その後、モデルが一般化を犠牲にして現在の環境固有の知識を優先する特殊化フェーズが観察されます。
従来の正則化戦略とモデル容量の増加は、この現象を軽減するのに効果がないことが判明しています。
リハーサルは少し有益ではありますが、かなりのメモリコストが追加されます。
具現化された設定で一般的に行われるように、アクション情報を組み込むと、より迅速な収束が促進されますが、特殊化が悪化して、モデルがその動きの予測に過度に依存し、視覚的な手がかりを正しく解釈する能力が低下します。
これらの発見は、生涯ロボット工学における適応と記憶保持のバランスをとるという未解決の課題を強調し、身体化されたエージェントに対する生涯パラダイムの適用への貴重な洞察に貢献する。
要約(オリジナル)
As robotics continues to advance, the need for adaptive and continuously-learning embodied agents increases, particularly in the realm of assistance robotics. Quick adaptability and long-term information retention are essential to operate in dynamic environments typical of humans’ everyday lives. A lifelong learning paradigm is thus required, but it is scarcely addressed by current robotics literature. This study empirically investigates the impact of catastrophic forgetting and the effectiveness of knowledge transfer in neural networks trained continuously in an embodied setting. We focus on the task of visual odometry, which holds primary importance for embodied agents in enabling their self-localization. We experiment on the simple continual scenario of discrete transitions between indoor locations, akin to a robot navigating different apartments. In this regime, we observe initial satisfactory performance with high transferability between environments, followed by a specialization phase where the model prioritizes current environment-specific knowledge at the expense of generalization. Conventional regularization strategies and increased model capacity prove ineffective in mitigating this phenomenon. Rehearsal is instead mildly beneficial but with the addition of a substantial memory cost. Incorporating action information, as commonly done in embodied settings, facilitates quicker convergence but exacerbates specialization, making the model overly reliant on its motion expectations and less adept at correctly interpreting visual cues. These findings emphasize the open challenges of balancing adaptation and memory retention in lifelong robotics and contribute valuable insights into the application of a lifelong paradigm on embodied agents.
arxiv情報
著者 | Paolo Cudrano,Xiaoyu Luo,Matteo Matteucci |
発行日 | 2024-06-03 21:32:50+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google