要約
直接手の届かないゴール領域にボール状の物体を配置するというタスクを与えられた場合、人間は多くの場合、物体を壁に投げたり、滑らせたり、跳ね返したりして、目標を達成することができます。
ただし、ロボットに同様の推論を可能にすることは簡単ではありません。
物理的推論のための既存の方法は大量のデータを必要とし、現実世界に固有の複雑さと不確実性と格闘しています。
この論文では、物理情報に基づいたニューラル ネットワーク (PINN) と修正されたモンテカルロ ツリー検索 (MCTS) を組み合わせて、身体化されたエージェントが動的物理タスクを実行できるようにする、新しい物理情報に基づいた計画フレームワークである PhyPlan について説明します。
PhyPlan は、PINN を活用してアクションの結果を迅速かつ正確にシミュレーションおよび予測し、計画には MCTS を使用します。
最適なポリシーを決定するために、PINN ベースのシミュレーターを参照するか (粗いが高速)、実際の環境に直接関与するか (細かいが遅い) を動的に決定します。
シミュレートされた 3D 環境でのロボットによる評価は、動的スキルの構成を含む 3D 物理的推論タスクを解決するための私たちのアプローチの能力を実証します。
定量的には、PhyPlan はいくつかの側面で優れています。(i) 最先端のものと比較して、新しいタスクを学習する際の後悔が少なくなります。(ii) スキルの学習を促進し、物理的推論の速度を高めます。(iii) より高いパフォーマンスを示します。
物理学に基づいていないアプローチと比較したデータ効率。
要約(オリジナル)
Given the task of positioning a ball-like object to a goal region beyond direct reach, humans can often throw, slide, or rebound objects against the wall to attain the goal. However, enabling robots to reason similarly is non-trivial. Existing methods for physical reasoning are data-hungry and struggle with complexity and uncertainty inherent in the real world. This paper presents PhyPlan, a novel physics-informed planning framework that combines physics-informed neural networks (PINNs) with modified Monte Carlo Tree Search (MCTS) to enable embodied agents to perform dynamic physical tasks. PhyPlan leverages PINNs to simulate and predict outcomes of actions in a fast and accurate manner and uses MCTS for planning. It dynamically determines whether to consult a PINN-based simulator (coarse but fast) or engage directly with the actual environment (fine but slow) to determine optimal policy. Evaluation with robots in simulated 3D environments demonstrates the ability of our approach to solve 3D-physical reasoning tasks involving the composition of dynamic skills. Quantitatively, PhyPlan excels in several aspects: (i) it achieves lower regret when learning novel tasks compared to state-of-the-art, (ii) it expedites skill learning and enhances the speed of physical reasoning, (iii) it demonstrates higher data efficiency compared to a physics un-informed approach.
arxiv情報
著者 | Harshil Vagadia,Mudit Chopra,Abhinav Barnawal,Tamajit Banerjee,Shreshth Tuli,Souvik Chakraborty,Rohan Paul |
発行日 | 2024-02-24 08:51:03+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google