Modular Customizable ROS-Based Framework for Rapid Development of Social Robots

要約

社会的に有能なロボットを開発するには、ロボット工学、コンピューター ビジョン、音声処理、Web テクノロジーを緊密に統合する必要があります。
私たちは、モジュラー階層アーキテクチャを通じてこのニーズに対処するオープンソース フレームワークである、ソーシャル インタラクティブ ロボット ソフトウェア プラットフォーム (SROS) を紹介します。
SROS は、標準メッセージングと API を使用して、モビリティのためのロボット オペレーティング システム (ROS) 層を Web および Android インターフェイス層と橋渡しします。
特殊な知覚スキルと対話型スキルが ROS サービスとして実装され、あらゆるロボットに再利用可能に展開されます。
これにより、知覚と物理的作動を同期させる共同行動の迅速なプロトタイピングが容易になります。
私たちは、コンピューター ビジョン、音声処理、プラグ アンド プレイ ROS サービスとして実装された GPT2 オートコンプリート音声などのコア SROS テクノロジーを実験的に検証しました。
モジュール性は、ハードウェアまたはソフトウェア プラットフォームを変更することなく、追加の ROS パッケージを正常に統合することによって実証されます。
有効になった機能は、同期されたクロスドメイン インタラクションを通じて社会的にインタラクティブなロボットの開発における SROS の有効性を裏付けています。
サンプルプラットフォーム上で同期されたマルチモーダルな動作を示すデモンストレーションを通じて、研究者が新しいアプリケーションを通じて適応的で協調的なカスタマイズ可能なヒューマンロボットシステムの最先端を進歩させるための障壁を下げることで、SROSアーキテクチャアプローチがどのように以前の研究の欠点に対処するかを説明します。
知覚能力と社会的能力を統合します。

要約(オリジナル)

Developing socially competent robots requires tight integration of robotics, computer vision, speech processing, and web technologies. We present the Socially-interactive Robot Software platform (SROS), an open-source framework addressing this need through a modular layered architecture. SROS bridges the Robot Operating System (ROS) layer for mobility with web and Android interface layers using standard messaging and APIs. Specialized perceptual and interactive skills are implemented as ROS services for reusable deployment on any robot. This facilitates rapid prototyping of collaborative behaviors that synchronize perception with physical actuation. We experimentally validated core SROS technologies including computer vision, speech processing, and GPT2 autocomplete speech implemented as plug-and-play ROS services. Modularity is demonstrated through the successful integration of an additional ROS package, without changes to hardware or software platforms. The capabilities enabled confirm SROS’s effectiveness in developing socially interactive robots through synchronized cross-domain interaction. Through demonstrations showing synchronized multimodal behaviors on an example platform, we illustrate how the SROS architectural approach addresses shortcomings of previous work by lowering barriers for researchers to advance the state-of-the-art in adaptive, collaborative customizable human-robot systems through novel applications integrating perceptual and social abilities.

arxiv情報

著者 Mahta Akhyani,Hadi Moradi
発行日 2023-11-27 12:54:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, cs.SE, cs.SY, eess.IV, eess.SY パーマリンク