Temporal Performance Prediction for Deep Convolutional Long Short-Term Memory Networks

要約

ディープ セマンティック セグメンテーション ネットワークの予測の不確実性を定量化することは、安全性が重要なタスクでは不可欠です。
ビデオ データが利用可能な自動運転などのアプリケーションでは、畳み込み長期短期記憶ネットワークは、セマンティック セグメンテーションを提供するだけでなく、次のタイムステップのセグメンテーションを予測することもできます。
これらのモデルは、セルの状態を使用して、時系列の入力を取得することで以前のデータから情報をブロードキャストし、将来の 1 つまたはさらに先のステップを予測します。
予測されたセグメントとグランドトゥルースセグメントの和集合を予測するか、和集合がゼロに等しいかゼロより大きいかを分類することによって、畳み込み長短期記憶ネットワークの予測パフォーマンスを推定する時間後処理方法を提案します。
この目的を達成するために、セグメントごとに時間セル状態ベースの入力メトリックを作成し、これらのメトリックに基づいて予測品質を推定するためのさまざまなモデルを調査します。
提案されたメトリクスに対して考慮されるセル状態の数の影響をさらに研究します。

要約(オリジナル)

Quantifying predictive uncertainty of deep semantic segmentation networks is essential in safety-critical tasks. In applications like autonomous driving, where video data is available, convolutional long short-term memory networks are capable of not only providing semantic segmentations but also predicting the segmentations of the next timesteps. These models use cell states to broadcast information from previous data by taking a time series of inputs to predict one or even further steps into the future. We present a temporal postprocessing method which estimates the prediction performance of convolutional long short-term memory networks by either predicting the intersection over union of predicted and ground truth segments or classifying between intersection over union being equal to zero or greater than zero. To this end, we create temporal cell state-based input metrics per segment and investigate different models for the estimation of the predictive quality based on these metrics. We further study the influence of the number of considered cell states for the proposed metrics.

arxiv情報

著者 Laura Fieback,Bidya Dash,Jakob Spiegelberg,Hanno Gottschalk
発行日 2023-11-13 17:11:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, I.4 パーマリンク