要約
オブジェクトのアフォーダンスを学習することは、ロボット学習の分野において有効な手段である。データ駆動型モデルでは、単一物体や対になった物体のアフォーダンスの探索が掘り下げられているが、複雑な形状を持つ任意の数の物体から構成される複合物体のアフォーダンスの調査には顕著なギャップがある。本研究では、複合オブジェクトのアフォーダンスをモデル化し、既存の複合オブジェクトの上に新しいオブジェクトを配置する効果を予測するMOGAN(Multi-Object Graph Affordance Network)を提案する。特定の高さや性質のタワーを建てるなどの異なるタスクが与えられた場合、適切なアフォーダンスを持つオブジェクトを積み重ねる一連の動作を見つけるために、探索に基づくプランニングを用いた。我々のシステムは、積み重ねられた球体やカップ、ポール、ポールを囲むリングを含む非常に複雑な複合オブジェクトのアフォーダンスを正しくモデル化できることを示した。我々は、シミュレートされた環境と実環境の両方で、我々のシステムの適用可能性を示し、ベースラインモデルと比較することで、その優位性を強調した。
要約(オリジナル)
Learning object affordances is an effective tool in the field of robot learning. While the data-driven models delve into the exploration of affordances of single or paired objects, there is a notable gap in the investigation of affordances of compound objects that are composed of an arbitrary number of objects with complex shapes. In this study, we propose Multi-Object Graph Affordance Network (MOGAN) that models compound object affordances and predicts the effect of placing new objects on top of the existing compound. Given different tasks, such as building towers of specific heights or properties, we used a search based planning to find the sequence of stack actions with the objects of suitable affordances. We showed that our system was able to correctly model the affordances of very complex compound objects that include stacked spheres and cups, poles, and rings that enclose the poles. We demonstrated the applicability of our system in both simulated and real-world environments, comparing our systems with a baseline model to highlight its advantages.
arxiv情報
著者 | Tuba Girgin,Emre Ugur |
発行日 | 2024-02-04 13:32:28+00:00 |
arxivサイト | arxiv_id(pdf) |