Active Perception for Tactile Sensing: A Task-Agnostic Attention-Based Approach

要約

人間は、触れたオブジェクトの特性をマッピングして識別するために、触覚探査を広範囲に使用します。
ロボット工学では、オブジェクト分類、形状再構築、操作などのタスクの視覚を補完する重要な研究領域として、アクティブな触覚認識が浮上しています。
この作業では、TAP(タスクと存在するアクティブな知覚)を紹介します。これは、部分的に観察可能な環境によってもたらされる課題に対処するために、強化学習(RL)と変圧器ベースのアーキテクチャを活用する新しいフレームワークです。
TAPは、統合された最適化目標内でソフトアクタークリティック(SAC)およびCrossQアルゴリズムを統合し、認識モジュールと意思決定ポリシーを共同でトレーニングします。
設計上、TAPは完全にタスクに依存しており、原則として、アクティブな知覚問題に一般化できます。
おもちゃの例や、触覚MNISTベンチマークからの3Dモデルの触覚的探索を含む現実的なアプリケーションなど、多様なタスクを介してタップを評価します。
実験は、タップの有効性を示しており、触覚ムニストの触覚桁認識タスクと触覚ポーズ推定タスクの高い精度を達成します。
これらの発見は、ロボット工学におけるアクティブな触覚認識を進めるための多用途で一般化可能なフレームワークとしてのTAPの可能性を強調しています。

要約(オリジナル)

Humans make extensive use of haptic exploration to map and identify the properties of the objects that we touch. In robotics, active tactile perception has emerged as an important research domain that complements vision for tasks such as object classification, shape reconstruction, and manipulation. This work introduces TAP (Task-agnostic Active Perception) — a novel framework that leverages reinforcement learning (RL) and transformer-based architectures to address the challenges posed by partially observable environments. TAP integrates Soft Actor-Critic (SAC) and CrossQ algorithms within a unified optimization objective, jointly training a perception module and decision-making policy. By design, TAP is completely task-agnostic and can, in principle, generalize to any active perception problem. We evaluate TAP across diverse tasks, including toy examples and realistic applications involving haptic exploration of 3D models from the Tactile MNIST benchmark. Experiments demonstrate the efficacy of TAP, achieving high accuracies on the Tactile MNIST haptic digit recognition task and a tactile pose estimation task. These findings underscore the potential of TAP as a versatile and generalizable framework for advancing active tactile perception in robotics.

arxiv情報

著者 Tim Schneider,Cristiana de Farias,Roberto Calandra,Liming Chen,Jan Peters
発行日 2025-05-09 16:49:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク