要約
このホワイトペーパーでは、RGB-Dカメラのみを使用してテーブルトップの片付け問題に対処するために設計された新しいフレームワークである、潮のスコアガイド付きモンテカルロツリー検索(TSMCTS)を紹介します。
テーブルトップの片付け問題の2つの主要な問題に対処します。(1)パブリックデータセットとベンチマークの欠如、および(2)目に見えないオブジェクトの目標構成を指定することの難しさ。
シミュレーションで収集された構造化されたデータセットであるTabletop Tidying Up(TTU)データセットを提示することにより、前者に対処します。
このデータセットを使用して、整頓スコアを予測できるビジョンベースの判別器をトレーニングします。
この識別器は、現実世界のシーンを含む、目に見えない構成全体の整頓の程度を一貫して評価できます。
2番目の問題に対処すると、モンテカルロツリー検索(MCTS)を使用して、明示的な目標を指定せずに片付けの軌跡を見つけます。
特定の目標を提供する代わりに、MCTSベースのプランナーがガイダンスとしてTidinessスコアを使用して多様な整頓された構成を見つけることができることを実証します。
その結果、TSMCTSを提案します。これは、最適な整頓された配置を見つけるために、MCTSベースの整頓プランナーと潮disdinessの識別器を統合します。
TSMCTは、コーヒーテーブル、ダイニングテーブル、オフィスデスク、バスルームなど、さまざまな環境でその機能を成功裏に実証しています。
TTUデータセットは、https://github.com/rllab-snu/ttu-datasetで入手できます。
要約(オリジナル)
In this paper, we present the tidiness score-guided Monte Carlo tree search (TSMCTS), a novel framework designed to address the tabletop tidying up problem using only an RGB-D camera. We address two major problems for tabletop tidying up problem: (1) the lack of public datasets and benchmarks, and (2) the difficulty of specifying the goal configuration of unseen objects. We address the former by presenting the tabletop tidying up (TTU) dataset, a structured dataset collected in simulation. Using this dataset, we train a vision-based discriminator capable of predicting the tidiness score. This discriminator can consistently evaluate the degree of tidiness across unseen configurations, including real-world scenes. Addressing the second problem, we employ Monte Carlo tree search (MCTS) to find tidying trajectories without specifying explicit goals. Instead of providing specific goals, we demonstrate that our MCTS-based planner can find diverse tidied configurations using the tidiness score as a guidance. Consequently, we propose TSMCTS, which integrates a tidiness discriminator with an MCTS-based tidying planner to find optimal tidied arrangements. TSMCTS has successfully demonstrated its capability across various environments, including coffee tables, dining tables, office desks, and bathrooms. The TTU dataset is available at: https://github.com/rllab-snu/TTU-Dataset.
arxiv情報
著者 | Hogun Kee,Wooseok Oh,Minjae Kang,Hyemin Ahn,Songhwai Oh |
発行日 | 2025-02-24 15:12:29+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google