NewsGPT: ChatGPT Integration for Robot-Reporter

要約

大規模言語モデル (LLM) とソーシャル ロボットの統合は、人工知能 (AI) によって生成されたニュース報道の信頼性が高まっている現在、人間とロボットのインタラクションを強化するための有望な手段として浮上しています。
この統合は強化され、ジャーナリズム、メディア、コミュニケーション、教育にとってより生産的なリソースとなることが予想されます。
この論文では、社会的相互作用を強化するためのロボットの自然言語理解と応答生成能力を向上させることを目的として、AI の生成事前学習変換器 (GPT) モデルと Pepper ロボットを統合する新しいシステムが提案されています。
GPT の強力な言語処理機能を活用することにより、このシステムは、音声入力の録音、音声からテキストへの転写、コンテキスト分析、およびテキストから音声への合成アクション生成を組み込んだ包括的なパイプラインを提供します。
Pepper ロボットは、ユーザーのクエリを理解し、一般的な知識に基づいて有益な応答を生成し、文脈に応じた会話を維持し、より専門分野に特化したニュース レポーターとして機能することができます。
また、ニュース リソースにもリンクされており、Google 検索機能も利用できます。
フレームワークのパフォーマンスを評価するために、一連のさまざまな質問を含む実験が実施されました。
ロボットの応答は、関連性、文脈、流暢性など 8 つの基準に基づいて評価されました。
いくつかの制限が確認されているにもかかわらず、このシステムは、LLM とソーシャル ロボットの統合の可能性を示すことで、ジャーナリズムと人間とロボットのインタラクションの分野に貢献します。
提案されたフレームワークは、ロボットの会話能力を向上させ、よりスムーズで、より魅力的で、よりコンテキストを認識した対話を可能にする機会を開きます。

要約(オリジナル)

The integration of large language models (LLMs) with social robots has emerged as a promising avenue for enhancing human-robot interactions at a time when news reports generated by artificial intelligence (AI) are gaining in credibility. This integration is expected to intensify and become a more productive resource for journalism, media, communication, and education. In this paper a novel system is proposed that integrates AI’s generative pretrained transformer (GPT) model with the Pepper robot, with the aim of improving the robot’s natural language understanding and response generation capabilities for enhanced social interactions. By leveraging GPT’s powerful language processing capabilities, this system offers a comprehensive pipeline that incorporates voice input recording, speech-to-text transcription, context analysis, and text-to-speech synthesis action generation. The Pepper robot is enabled to comprehend user queries, generate informative responses with general knowledge, maintain contextually relevant conversations, and act as a more domain-oriented news reporter. It is also linked with a news resource and powered with a Google search capability. To evaluate the performance of the framework, experiments were conducted involving a set of diverse questions. The robot’s responses were assessed on the basis of eight criteria, including relevance, context, and fluency. Despite some identified limitations, this system contributes to the field of journalism and human-robot interaction by showcasing the potential of integrating LLMs with social robots. The proposed framework opens up opportunities for improving the conversational capabilities of robots, enabling interactions that are smoother, more engaging, and more context aware.

arxiv情報

著者 Abdelhadi Hireche,Abdelkader Nasreddine Belkacem,Sadia Jamil,Chao Chen
発行日 2023-11-11 18:39:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.HC, cs.MM, cs.RO パーマリンク