要約
実際の設定では、ロボットは多様なタスク全体で人間を支援し、時間の経過とともに動的な変化に継続的に適応することが期待されています。
たとえば、国内環境では、ロボットは、学習したルーチンに基づいて必要なオブジェクトを取得することでユーザーを積極的に支援できます。
ただし、これらの相互作用からのデータは本質的に非依存性であり、非同意的に分散されています(非I.I.D。)。たとえば、複数のユーザーを支援するロボットは、個人が異なる習慣に従うため、さまざまなデータ分布に遭遇する可能性があります。
これは挑戦を生み出します:壊滅的な忘却なしで新しい知識を統合することです。
これに対処するために、実世界のロボット学習のための継続的な学習フレームワークであるストリーク(適応知識保持による空間時間的再配置)を提案します。
ストリーミンググラフのニューラルネットワークを、正則化とリハーサル手法で活用して、過去の知識を保持しながら、コンテキストドリフトを緩和します。
私たちの方法は時間的およびメモリ効率が高く、過去のすべてのデータを再訓練せずに長期学習を可能にします。これは、実際の相互作用でデータが増加するにつれて実行不可能になります。
私たちは、異なる世帯で50日以上にわたって人間のルーチンを徐々に予測するタスクに関する連勝を評価します。
結果は、一般化を維持しながら壊滅的な忘却を効果的に防止し、長期的な人間とロボットの相互作用のためのスケーラブルなソリューションになっていることを示しています。
要約(オリジナル)
In real-world settings, robots are expected to assist humans across diverse tasks and still continuously adapt to dynamic changes over time. For example, in domestic environments, robots can proactively help users by fetching needed objects based on learned routines, which they infer by observing how objects move over time. However, data from these interactions are inherently non-independent and non-identically distributed (non-i.i.d.), e.g., a robot assisting multiple users may encounter varying data distributions as individuals follow distinct habits. This creates a challenge: integrating new knowledge without catastrophic forgetting. To address this, we propose STREAK (Spatio Temporal RElocation with Adaptive Knowledge retention), a continual learning framework for real-world robotic learning. It leverages a streaming graph neural network with regularization and rehearsal techniques to mitigate context drifts while retaining past knowledge. Our method is time- and memory-efficient, enabling long-term learning without retraining on all past data, which becomes infeasible as data grows in real-world interactions. We evaluate STREAK on the task of incrementally predicting human routines over 50+ days across different households. Results show that it effectively prevents catastrophic forgetting while maintaining generalization, making it a scalable solution for long-term human-robot interactions.
arxiv情報
著者 | Ermanno Bartoli,Fethiye Irmak Dogan,Iolanda Leite |
発行日 | 2025-04-07 11:58:59+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google