Neural Style Transfer with Twin-Delayed DDPG for Shared Control of Robotic Manipulators

要約

ニューラル スタイル転送 (NST) は、要素 (ほとんどの場合画像) を操作して、別の要素の外観やスタイルを採用できるアルゴリズムのクラスを指します。
各要素は、コンテンツとスタイルの組み合わせとして定義されます。概念的には、コンテンツはその要素の内容として、スタイルはその要素の方法として定義できます。
これに関連して、ロボットマニピュレーターの動きに一連のスタイルを転送するためのカスタム NST フレームワークを提案します。たとえば、同じロボットタスクを、怒り、幸せ、穏やか、または悲しみの方法で実行できます。
オートエンコーダ アーキテクチャは、ターゲット ロボットの動作のコンテンツとスタイルを抽出して定義します。
Twin Delayed Deep Deterministic Policy Gradient (TD3) ネットワークは、オートエンコーダーによって定義された損失を使用してロボット制御ポリシーを生成します。
提案されている Neural Policy Style Transfer TD3 (NPST3) は、訓練されたスタイルを導入することでロボットの動作を変更します。
このようなアプローチは、動的環境でロボットの自律動作を実行するためにオフラインで実装することも、遠隔操作ロボットのスタイルを実行時に適応させるためにオンラインで実装することもできます。
検討されたスタイルは、人間によるデモンストレーションからオンラインで学ぶことができます。
私たちは、73 人のボランティアを登録した人間の被験者による評価を実施し、いくつかの代表的なロボット動作の背後にあるスタイルを認識するように依頼しました。
結果は良好な認識率を示し、このアプローチを使用してさまざまなスタイルをロボットに伝えることが可能であることを証明しました。

要約(オリジナル)

Neural Style Transfer (NST) refers to a class of algorithms able to manipulate an element, most often images, to adopt the appearance or style of another one. Each element is defined as a combination of Content and Style: the Content can be conceptually defined as the what and the Style as the how of said element. In this context, we propose a custom NST framework for transferring a set of styles to the motion of a robotic manipulator, e.g., the same robotic task can be carried out in an angry, happy, calm, or sad way. An autoencoder architecture extracts and defines the Content and the Style of the target robot motions. A Twin Delayed Deep Deterministic Policy Gradient (TD3) network generates the robot control policy using the loss defined by the autoencoder. The proposed Neural Policy Style Transfer TD3 (NPST3) alters the robot motion by introducing the trained style. Such an approach can be implemented either offline, for carrying out autonomous robot motions in dynamic environments, or online, for adapting at runtime the style of a teleoperated robot. The considered styles can be learned online from human demonstrations. We carried out an evaluation with human subjects enrolling 73 volunteers, asking them to recognize the style behind some representative robotic motions. Results show a good recognition rate, proving that it is possible to convey different styles to a robot using this approach.

arxiv情報

著者 Raul Fernandez-Fernandez,Marco Aggravi,Paolo Robuffo Giordano,Juan G. Victores,Claudio Pacchierotti
発行日 2024-02-01 16:14:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.NE, cs.RO パーマリンク