ChatGPT Empowered Long-Step Robot Control in Various Environments: A Case Application

要約

この論文では、OpenAI の ChatGPT を数ショット設定で使用して、自然言語命令を一連の実行可能なロボット アクションに変換する方法を示します。
この論文では、ChatGPT のトークン制限の影響を最小限に抑えながら、ロボット実行システムとの簡単な統合やさまざまな環境への適用性など、実際のアプリケーションにおける一般的な要件を満たす、カスタマイズが簡単な ChatGPT の入力プロンプトを提案しています。
プロンプトは、ChatGPT が事前定義されたロボットのアクションのシーケンスを出力し、動作環境を形式化されたスタイルで表現し、動作環境の更新された状態を推測することを促します。
実験により、提案されたプロンプトにより、ChatGPT がさまざまな環境の要件に従って動作できることが確認され、ユーザーは安全で堅牢な操作のために自然言語フィードバックを使用して ChatGPT の出力を調整できることが確認されました。
提案されたプロンプトとソース コードはオープンソースであり、https://github.com/microsoft/ChatGPT-Robot-Manipulation-Prompts で公開されています。

要約(オリジナル)

This paper demonstrates how OpenAI’s ChatGPT can be used in a few-shot setting to convert natural language instructions into a sequence of executable robot actions. The paper proposes easy-to-customize input prompts for ChatGPT that meet common requirements in practical applications, such as easy integration with robot execution systems and applicability to various environments while minimizing the impact of ChatGPT’s token limit. The prompts encourage ChatGPT to output a sequence of predefined robot actions, represent the operating environment in a formalized style, and infer the updated state of the operating environment. Experiments confirmed that the proposed prompts enable ChatGPT to act according to requirements in various environments, and users can adjust ChatGPT’s output with natural language feedback for safe and robust operation. The proposed prompts and source code are open-source and publicly available at https://github.com/microsoft/ChatGPT-Robot-Manipulation-Prompts

arxiv情報

著者 Naoki Wake,Atsushi Kanehira,Kazuhiro Sasabuchi,Jun Takamatsu,Katsushi Ikeuchi
発行日 2023-08-30 03:38:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク