要約
学習ベースの推定器とコントローラーを統合し、接触集中型のタスクに対処するように設計された 2 段階のフレームワークを紹介します。
この推定器は、混合密度ネットワーク (MDN) 構造を備えたベイジアン粒子フィルターを活用し、連絡先情報から生じるマルチモーダルな問題を効果的に処理します。
コントローラーは自己教師あり強化学習 (RL) アプローチを組み合わせ、低レベルのアドミタンス コントローラーのパラメーターをラベル付け可能なカテゴリーとラベル付け不可能なカテゴリーに戦略的に分割し、それに応じてトレーニングします。
精度と汎化パフォーマンスをさらに向上させるために、トランスフォーマー モデルが自己教師あり学習コンポーネントに組み込まれています。
提案されたフレームワークは、正確なリアルタイム シミュレーターを使用してボルト締めタスクで評価され、実験環境への移行に成功しました。
さらに多くの視覚化結果は、プロジェクト Web サイトで入手できます: https://sites.google.com/view/2stagecitt
要約(オリジナル)
We present a two-stage framework that integrates a learning-based estimator and a controller, designed to address contact-intensive tasks. The estimator leverages a Bayesian particle filter with a mixture density network (MDN) structure, effectively handling multi-modal issues arising from contact information. The controller combines a self-supervised and reinforcement learning (RL) approach, strategically dividing the low-level admittance controller’s parameters into labelable and non-labelable categories, which are then trained accordingly. To further enhance accuracy and generalization performance, a transformer model is incorporated into the self-supervised learning component. The proposed framework is evaluated on the bolting task using an accurate real-time simulator and successfully transferred to an experimental environment. More visualization results are available on our project website: https://sites.google.com/view/2stagecitt
arxiv情報
著者 | Bukun Son,Hyelim Choi,Jaemin Yoon,Dongjun Lee |
発行日 | 2023-08-01 06:23:59+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google