SHARPIE: A Modular Framework for Reinforcement Learning and Human-AI Interaction Experiments

要約

Renforce Learning(RL)は、人間との相互作用シナリオを含むAIエージェントをモデリングおよびトレーニングするための一般的なアプローチを提供します。
この論文では、RLエージェントと人間との実験をサポートするための一般的なフレームワークの必要性に対処するために、Sharpie(インタラクティブな実験のための共有された人間補強学習プラットフォーム)を提案します。
そのモジュラー設計は、RL環境とアルゴリズムライブラリの汎用性の高いラッパー、参加者向けのWebインターフェイス、ロギングユーティリティ、人気のあるクラウドおよび参加者の採用プラットフォームへの展開で構成されています。
研究者は、インタラクティブな報酬仕様と学習、人間のフィードバック、アクション代表団、選好の誘発、ユーザーモデリング、および人間aiに関連するものを含む、人間とRLエージェントの間の相互作用に関連するさまざまな研究質問を研究することができます。
チーム化。
このプラットフォームは、ヒトの文脈におけるRLの研究分野を標準化することを目的とするヒューマンRL相互作用の一般的なインターフェイスに基づいています。

要約(オリジナル)

Reinforcement learning (RL) offers a general approach for modeling and training AI agents, including human-AI interaction scenarios. In this paper, we propose SHARPIE (Shared Human-AI Reinforcement Learning Platform for Interactive Experiments) to address the need for a generic framework to support experiments with RL agents and humans. Its modular design consists of a versatile wrapper for RL environments and algorithm libraries, a participant-facing web interface, logging utilities, deployment on popular cloud and participant recruitment platforms. It empowers researchers to study a wide variety of research questions related to the interaction between humans and RL agents, including those related to interactive reward specification and learning, learning from human feedback, action delegation, preference elicitation, user-modeling, and human-AI teaming. The platform is based on a generic interface for human-RL interactions that aims to standardize the field of study on RL in human contexts.

arxiv情報

著者 Hüseyin Aydın,Kevin Dubois-Godin,Libio Goncalvez Braz,Floris den Hengst,Kim Baraka,Mustafa Mert Çelikok,Andreas Sauter,Shihan Wang,Frans A. Oliehoek
発行日 2025-01-31 15:59:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.HC パーマリンク