Conformalized Multimodal Uncertainty Regression and Reasoning

要約

この論文では、等角予測と深層学習リグレッサーを統合することにより、マルチモーダル (素) 不確実性境界を予測できる軽量の不確実性推定器を紹介します。
特に、フライングドメインの対称性や曖昧さや閉塞下でのセンサー測定などの環境特徴により、マルチモーダルな不確実性が生じる可能性があるビジュアル オドメトリ (VO) への応用について説明します。
私たちのシミュレーション結果は、私たちのフレームワークの不確実性推定が、顕著なノイズ、限られたトレーニングデータ、予測モデルの限られたパラメトリックサイズなどの困難な動作条件に対してサンプル単位で適応していることを示しています。
また、これらの堅牢な不確実性推定を活用し、予測の予測精度を向上させるためにオプティカル フロー ベースの推論を組み込む推論フレームワークも開発します。
したがって、データ駆動型学習の予測不確実性を適切に考慮し、ルールベースの推論によって推定ループを閉じることにより、私たちの方法論は、顕著なノイズ、限られたトレーニングデータ、限られたモデルサイズなど、これらすべての困難なシナリオにおいて従来の深層学習アプローチを常に上回ります。
– 予測誤差を 2 ~ 3 分の 1 に削減します。

要約(オリジナル)

This paper introduces a lightweight uncertainty estimator capable of predicting multimodal (disjoint) uncertainty bounds by integrating conformal prediction with a deep-learning regressor. We specifically discuss its application for visual odometry (VO), where environmental features such as flying domain symmetries and sensor measurements under ambiguities and occlusion can result in multimodal uncertainties. Our simulation results show that uncertainty estimates in our framework adapt sample-wise against challenging operating conditions such as pronounced noise, limited training data, and limited parametric size of the prediction model. We also develop a reasoning framework that leverages these robust uncertainty estimates and incorporates optical flow-based reasoning to improve prediction prediction accuracy. Thus, by appropriately accounting for predictive uncertainties of data-driven learning and closing their estimation loop via rule-based reasoning, our methodology consistently surpasses conventional deep learning approaches on all these challenging scenarios–pronounced noise, limited training data, and limited model size-reducing the prediction error by 2-3x.

arxiv情報

著者 Domenico Parente,Nastaran Darabi,Alex C. Stutts,Theja Tulabandhula,Amit Ranjan Trivedi
発行日 2023-09-20 02:40:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, cs.RO パーマリンク