Uncertainty-Aware Deployment of Pre-trained Language-Conditioned Imitation Learning Policies


さまざまなタスクやロボット プラットフォームからのデータに基づいてトレーニングされた大規模なロボット ポリシーは、汎用ロボットの実現に大きな期待を持っています。
このような 3 つの事前トレーニング済みモデルを使用してシミュレーションでアプローチを実装し、タスクの完了率を大幅に向上させる可能性を示します。
付属のコードはリンクからアクセスできます: https://github.com/BobWu1998/uncertainty_quant_all.git


Large-scale robotic policies trained on data from diverse tasks and robotic platforms hold great promise for enabling general-purpose robots; however, reliable generalization to new environment conditions remains a major challenge. Toward addressing this challenge, we propose a novel approach for uncertainty-aware deployment of pre-trained language-conditioned imitation learning agents. Specifically, we use temperature scaling to calibrate these models and exploit the calibrated model to make uncertainty-aware decisions by aggregating the local information of candidate actions. We implement our approach in simulation using three such pre-trained models, and showcase its potential to significantly enhance task completion rates. The accompanying code is accessible at the link: https://github.com/BobWu1998/uncertainty_quant_all.git


著者 Bo Wu,Bruce D. Lee,Kostas Daniilidis,Bernadette Bucher,Nikolai Matni
発行日 2024-07-28 14:21:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, cs.RO パーマリンク