Mini-BEHAVIOR: A Procedurally Generated Benchmark for Long-horizon Decision-Making in Embodied AI

要約

私たちは、人間の日常的な課題に似た複雑なアクティビティを解決するためにエージェントに推論と意思決定のスキルを使用させる、身体化型 AI の新しいベンチマークである Mini-BEHAVIOR を紹介します。
Mini-BEHAVIOR 環境は、高速で現実的な Gridworld 環境であり、複雑に組み込まれた AI ベンチマークに見られる象徴的なレベルの物理的リアリズムと複雑さを維持しながら、ラピッド プロトタイピングと使いやすさの利点を提供します。
手続き型生成などの重要な機能を導入して、無数のタスクのバリエーションの作成を可能にし、自由な学習をサポートします。
Mini-BEHAVIOR は、元の BEHAVIOR ベンチマークからのさまざまな家事タスクの実装と、データ収集および強化学習エージェント トレーニング用のスターター コードを提供します。
基本的に、Mini-BEHAVIOR は、組み込まれた AI における意思決定と計画ソリューションを評価するための、高速かつ無制限のベンチマークを提供します。
これは、研究のためのユーザーフレンドリーなエントリポイントとして機能し、ソリューションの評価と開発を促進し、組み込み型 AI の分野を進歩させながら、評価と開発を簡素化します。
コードは https://github.com/StanfordVL/mini_behavior で公開されています。

要約(オリジナル)

We present Mini-BEHAVIOR, a novel benchmark for embodied AI that challenges agents to use reasoning and decision-making skills to solve complex activities that resemble everyday human challenges. The Mini-BEHAVIOR environment is a fast, realistic Gridworld environment that offers the benefits of rapid prototyping and ease of use while preserving a symbolic level of physical realism and complexity found in complex embodied AI benchmarks. We introduce key features such as procedural generation, to enable the creation of countless task variations and support open-ended learning. Mini-BEHAVIOR provides implementations of various household tasks from the original BEHAVIOR benchmark, along with starter code for data collection and reinforcement learning agent training. In essence, Mini-BEHAVIOR offers a fast, open-ended benchmark for evaluating decision-making and planning solutions in embodied AI. It serves as a user-friendly entry point for research and facilitates the evaluation and development of solutions, simplifying their assessment and development while advancing the field of embodied AI. Code is publicly available at https://github.com/StanfordVL/mini_behavior.

arxiv情報

著者 Emily Jin,Jiaheng Hu,Zhuoyi Huang,Ruohan Zhang,Jiajun Wu,Li Fei-Fei,Roberto Martín-Martín
発行日 2023-12-27 20:49:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク