要約
ロボットに連続空間再配置スタイルのタスクが、それぞれの間で持続する環境で一度に 1 つずつ割り当てられる、逐次タスクと動作計画 (tamp) 設定を検討します。
将来のタスクに関する事前の知識が不足しているため、既存の (近視眼的な) 計画戦略は、将来のアクセスや操作をブロックするなど、後続のタスクの完了を妨げる副作用を知らず知らずのうちにもたらします。
我々は、予測的なタスクと動作の計画を提示します。この計画では、学習されたモデルから予想される将来のコストの推定値が、そのような副作用を回避するためにモデルベースのタンププランナーによって生成された計画の選択に情報を提供し、タスクと動作の両方を完了する環境の構成を選択します。
全体的なコストを最小限に抑えます。
可動障害物間のナビゲーションおよびキャビネット積載ドメインにおけるマルチタスク展開のシミュレーションにより、タスクあたりの平均コストがそれぞれ 32.7% と 16.7% 向上しました。
環境を準備するために事前に時間を与えた場合、学習拡張計画アプローチでは 83.1% と 22.3% の改善が得られます。
どちらも私たちのアプローチの価値を示しています。
最後に、現実世界の Fetch モバイル マニピュレータでの予期的タンプも示します。
要約(オリジナル)
We consider a sequential task and motion planning (tamp) setting in which a robot is assigned continuous-space rearrangement-style tasks one-at-a-time in an environment that persists between each. Lacking advance knowledge of future tasks, existing (myopic) planning strategies unwittingly introduce side effects that impede completion of subsequent tasks: e.g., by blocking future access or manipulation. We present anticipatory task and motion planning, in which estimates of expected future cost from a learned model inform selection of plans generated by a model-based tamp planner so as to avoid such side effects, choosing configurations of the environment that both complete the task and minimize overall cost. Simulated multi-task deployments in navigation-among-movable-obstacles and cabinet-loading domains yield improvements of 32.7% and 16.7% average per-task cost respectively. When given time in advance to prepare the environment, our learning-augmented planning approach yields improvements of 83.1% and 22.3%. Both showcase the value of our approach. Finally, we also demonstrate anticipatory tamp on a real-world Fetch mobile manipulator.
arxiv情報
著者 | Roshan Dhakal,Duc M. Nguyen,Tom Silver,Xuesu Xiao,Gregory J. Stein |
発行日 | 2024-07-18 16:59:33+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google