要約
身体化された AI は、未踏の環境で動作することで大きな進歩を遂げました。
ただし、オブジェクト検索などのタスクは主に効率的なポリシー学習に重点を置いています。
この研究では、現在の検索方法にあるいくつかのギャップを特定します。それらは主に、古い知覚モデルに焦点を当て、時間的な集約を無視し、結果として生じる知覚状態の過信を考慮せずに、テスト時にグランド トゥルースからノイズのある知覚に直接移行します。
私たちは、集計および見つかった決定全体にわたる調整された認識確率と不確実性を通じて、特定された問題に対処し、それによってモデルを逐次的なタスクに適応させます。
結果として得られるメソッドは、追加のトレーニング費用をかけずに、既存の検索アプローチの幅広いファミリーにわたる事前トレーニング済みモデルと直接統合できます。
私たちは、さまざまな意味認識モデルとポリシーの両方にわたって集計方法の広範な評価を実行し、集計と見つかった決定の両方における調整された不確実性の重要性を確認しています。
コードとトレーニング済みモデルは https://semantic-search.cs.uni-freiburg.de で入手できます。
要約(オリジナル)
Embodied AI has made significant progress acting in unexplored environments. However, tasks such as object search have largely focused on efficient policy learning. In this work, we identify several gaps in current search methods: They largely focus on dated perception models, neglect temporal aggregation, and transfer from ground truth directly to noisy perception at test time, without accounting for the resulting overconfidence in the perceived state. We address the identified problems through calibrated perception probabilities and uncertainty across aggregation and found decisions, thereby adapting the models for sequential tasks. The resulting methods can be directly integrated with pretrained models across a wide family of existing search approaches at no additional training cost. We perform extensive evaluations of aggregation methods across both different semantic perception models and policies, confirming the importance of calibrated uncertainties in both the aggregation and found decisions. We make the code and trained models available at https://semantic-search.cs.uni-freiburg.de.
arxiv情報
著者 | Sai Prasanna,Daniel Honerkamp,Kshitij Sirohi,Tim Welschehold,Wolfram Burgard,Abhinav Valada |
発行日 | 2025-01-14 10:27:40+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google