要約
実世界では、ロボットは多様なタスクで人間を支援し、なおかつ時間経過に伴うダイナミックな変化に継続的に適応することが期待されている。例えば、家庭環境において、ロボットは学習されたルーチンに基づいて必要な物を取ってくることで、ユーザーを積極的に支援することができる。しかし、このようなインタラクションから得られるデータは、本質的に非独立的であり、非同一分布(non-i.i.d.)である。例えば、複数のユーザーを支援するロボットは、個人が異なる習慣に従っているため、様々なデータ分布に遭遇する可能性がある。これは、壊滅的な忘却なしに新しい知識を統合するという課題を生み出す。これに対処するために、我々はSTREAK(Spatio Temporal RElocation with Adaptive Knowledge retention)を提案する。STREAKは、実世界のロボット学習のための継続的学習フレームワークである。STREAKは、ストリーミンググラフニューラルネットワークと、正則化およびリハーサル技術を活用し、過去の知識を保持しながらコンテキストのドリフトを緩和する。本手法は時間効率とメモリ効率が高く、実世界のインタラクションにおいてデータが増大するにつれて実行不可能となる、過去の全てのデータに対する再学習を行うことなく、長期的な学習を可能にする。我々はSTREAKを、様々な家庭における50日以上の人間の行動を段階的に予測するタスクで評価した。その結果、STREAKは汎化を維持しつつ、壊滅的な忘却を効果的に防ぐことができ、長期的な人間とロボットの相互作用のためのスケーラブルなソリューションであることが示された。
要約(オリジナル)
In real-world settings, robots are expected to assist humans across diverse tasks and still continuously adapt to dynamic changes over time. For example, in domestic environments, robots can proactively help users by fetching needed objects based on learned routines, which they infer by observing how objects move over time. However, data from these interactions are inherently non-independent and non-identically distributed (non-i.i.d.), e.g., a robot assisting multiple users may encounter varying data distributions as individuals follow distinct habits. This creates a challenge: integrating new knowledge without catastrophic forgetting. To address this, we propose STREAK (Spatio Temporal RElocation with Adaptive Knowledge retention), a continual learning framework for real-world robotic learning. It leverages a streaming graph neural network with regularization and rehearsal techniques to mitigate context drifts while retaining past knowledge. Our method is time- and memory-efficient, enabling long-term learning without retraining on all past data, which becomes infeasible as data grows in real-world interactions. We evaluate STREAK on the task of incrementally predicting human routines over 50+ days across different households. Results show that it effectively prevents catastrophic forgetting while maintaining generalization, making it a scalable solution for long-term human-robot interactions.
arxiv情報
| 著者 | Ermanno Bartoli,Fethiye Irmak Dogan,Iolanda Leite |
| 発行日 | 2025-04-03 07:55:09+00:00 |
| arxivサイト | arxiv_id(pdf) |