Embodied Visuomotor Representation

要約

あなたの机に座って、その上のさまざまなオブジェクトを見て想像してみてください。
メートルで目からの正確な距離を知りませんが、手を伸ばして触れることができます。
外部から定義されたユニットの代わりに、あなたの距離感は本質的にあなたの具体化に対するあなたの行動の影響に結び付けられています。
対照的に、従来のロボット工学は、個別のビジョンと制御プロセスが通信する外部ユニットへの正確なキャリブレーションに依存しています。
これには、簡単に再構成できない高度に設計された高価なシステムが必要です。
これに対処するために、具体化された視覚運動表現を紹介します。これは、ロボットが彼らの行動によって暗示されるユニットの距離を推測する方法論です。
つまり、キャリブレーションされた3Dセンサーまたは既知の物理モデルに依存しないことです。
それに伴い、そのサイズ、環境スケール、または強度を事前に知ることのないロボットは、操作後数秒以内に障害物に触れてクリアすることをすぐに学ぶことができることを示しています。
同様に、シミュレーションでは、その質量または強度の知識のないエージェントは、いくつかのテスト振動の後、未知のサイズのギャップを正常にジャンプすることができます。
これらの行動は、ミツバチやスナネズミで観察される自然戦略を反映しており、外部ユニットのキャリブレーションも欠けており、ロボット工学のアクション主導型の知覚の可能性を強調しています。

要約(オリジナル)

Imagine sitting at your desk, looking at various objects on it. While you do not know their exact distances from your eye in meters, you can reach out and touch them. Instead of an externally defined unit, your sense of distance is inherently tied to your action’s effect on your embodiment. In contrast, conventional robotics relies on precise calibration to external units with which separate vision and control processes communicate. This necessitates highly engineered and expensive systems that cannot be easily reconfigured. To address this, we introduce Embodied Visuomotor Representation, a methodology through which robots infer distance in a unit implied by their actions. That is, without depending on calibrated 3D sensors or known physical models. With it, we demonstrate that a robot without prior knowledge of its size, environmental scale, or strength can quickly learn to touch and clear obstacles within seconds of operation. Likewise, in simulation, an agent without knowledge of its mass or strength can successfully jump across a gap of unknown size after a few test oscillations. These behaviors mirror natural strategies observed in bees and gerbils, which also lack calibration in an external unit, and highlight the potential for action-driven perception in robotics.

arxiv情報

著者 Levi Burner,Cornelia Fermüller,Yiannis Aloimonos
発行日 2025-04-24 22:07:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク