要約
ソーシャル ロボットが日常生活にますます統合されるようになるにつれ、その動作が社会規範に沿っていることを確認することが重要になります。
オープンワールドで広く応用するには、個々のロボットが互いの経験から学びながら、独自の環境について学習できるフェデレーテッド ラーニング (FL) 設定を検討することが重要です。
この論文では、マルチラベル回帰目標を使用してさまざまな戦略を評価する新しい FL ベンチマークを紹介します。このベンチマークでは、各クライアントが、さまざまなロボットの行動の社会的適切性を予測する方法を個別に学習しながら、その学習を他のクライアントと共有します。
さらに、各クライアントがコンテキスト間で段階的に学習できるように、トレーニング データをさまざまなコンテキストごとに分割し、最先端の継続学習 (CL) メソッドを使用するように FL ベースのメソッドを適応させる新しいフェデレーション継続学習 (FCL) ベンチマークを提示します。
さまざまな状況設定の下で社会的に適切なエージェントの行動を継続的に学習します。
重みの連合平均化 (FedAvg) は堅牢な FL 戦略として登場し、リハーサルベースの FCL により、コンテキスト分割全体でロボットの動作の社会的適切性を段階的に学習できます。
要約(オリジナル)
As social robots become increasingly integrated into daily life, ensuring their behaviours align with social norms is crucial. For their widespread open-world application, it is important to explore Federated Learning (FL) settings where individual robots can learn about their unique environments while also learning from each others’ experiences. In this paper, we present a novel FL benchmark that evaluates different strategies, using multi-label regression objectives, where each client individually learns to predict the social appropriateness of different robot actions while also sharing their learning with others. Furthermore, splitting the training data by different contexts such that each client incrementally learns across contexts, we present a novel Federated Continual Learning (FCL) benchmark that adapts FL-based methods to use state-of-the-art Continual Learning (CL) methods to continually learn socially appropriate agent behaviours under different contextual settings. Federated Averaging (FedAvg) of weights emerges as a robust FL strategy while rehearsal-based FCL enables incrementally learning the social appropriateness of robot actions, across contextual splits.
arxiv情報
著者 | Saksham Checker,Nikhil Churamani,Hatice Gunes |
発行日 | 2024-03-12 12:16:40+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google