要約
四足動物への注目が高まるにつれ、さまざまなロボット モデルや感覚入力を処理できる汎用化されたポリシーが非常に有益になります。
さまざまな形態に対処するためにいくつかの方法が提案されていますが、学習ベースのポリシーにとって固有受容情報のさまざまな組み合わせを管理することは依然として課題です。
この論文では、四足歩行のためのマスキングを備えた新しいトランスベースのモデルである、マスクされた感覚時間的注意 (MSTA) を紹介します。
センサーレベルの直接的な注意を採用して、感覚と時間の理解を強化し、センサーデータのさまざまな組み合わせを処理し、目に見えない情報を組み込むための基盤として機能します。
このモデルは、情報の大部分が欠落している場合でもその状態を効果的に理解することができ、入力シーケンスが長いにもかかわらず、物理システムに導入できる十分な柔軟性を備えています。
要約(オリジナル)
With the rising focus on quadrupeds, a generalized policy capable of handling different robot models and sensory inputs will be highly beneficial. Although several methods have been proposed to address different morphologies, it remains a challenge for learning-based policies to manage various combinations of proprioceptive information. This paper presents Masked Sensory-Temporal Attention (MSTA), a novel transformer-based model with masking for quadruped locomotion. It employs direct sensor-level attention to enhance sensory-temporal understanding and handle different combinations of sensor data, serving as a foundation for incorporating unseen information. This model can effectively understand its states even with a large portion of missing information, and is flexible enough to be deployed on a physical system despite the long input sequence.
arxiv情報
著者 | Dikai Liu,Tianwei Zhang,Jianxiong Yin,Simon See |
発行日 | 2024-09-05 08:11:42+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google