SegXAL: Explainable Active Learning for Semantic Segmentation in Driving Scene Scenarios

要約

洗練された AI モデルのほとんどは、ハイエンドのパフォーマンスを実現するために、大量の注釈付きデータと大量のトレーニングを利用します。
ただし、AI モデルの「実際の」シナリオの展開を妨げる特定の課題があります。つまり、ラベルのないデータの非効率的な使用、人間の専門知識の組み込みの欠如、結果の解釈の欠如などです。
これらの課題を軽減するために、我々は、(i) ラベルのないデータを効果的に利用し、(ii) 「人間の中にいる人間」
ループのパラダイム、および (iii) 解釈可能な方法でモデルの決定を強化します。
特に、運転シーンのシナリオにおけるセマンティック セグメンテーションに対する SegXAL モデルの適用を調査します。
SegXAL モデルは、説明可能な AI (XAI) と弱教師方式の不確実性測定による、Oracle からのラベル付け支援を必要とする画像領域を提案します。
具体的には、説明可能なエラーマスクを取得するための新しい近接認識説明可能 AI (PAE) モジュールとエントロピーベースの不確実性 (EBU) モジュールを提案します。これにより、機械教師/人間の専門家が結果の背後にある直感的な推論を提供し、要求を求めることができます。
アクティブラーニング戦略を介して AI システムにフィードバックします。
このようなメカニズムは、人間と AI が互いの補完的な強みを積極的に強化する協調知能を通じて、人間と機械の間の意味論的なギャップを橋渡しします。
DICE 類似性係数に基づく新しい信頼性の高いサンプル選択手法も SegXAL フレームワーク内で提供されます。
都市景観データセットのベンチマークでは、広範な定量的分析と定性的分析が実行されます。
結果は、他の最先端モデルと比較して、私たちが提案した SegXAL のパフォーマンスが優れていることを示しています。

要約(オリジナル)

Most of the sophisticated AI models utilize huge amounts of annotated data and heavy training to achieve high-end performance. However, there are certain challenges that hinder the deployment of AI models ‘in-the-wild’ scenarios, i.e., inefficient use of unlabeled data, lack of incorporation of human expertise, and lack of interpretation of the results. To mitigate these challenges, we propose a novel Explainable Active Learning (XAL) model, XAL-based semantic segmentation model ‘SegXAL’, that can (i) effectively utilize the unlabeled data, (ii) facilitate the ‘Human-in-the-loop’ paradigm, and (iii) augment the model decisions in an interpretable way. In particular, we investigate the application of the SegXAL model for semantic segmentation in driving scene scenarios. The SegXAL model proposes the image regions that require labeling assistance from Oracle by dint of explainable AI (XAI) and uncertainty measures in a weakly-supervised manner. Specifically, we propose a novel Proximity-aware Explainable-AI (PAE) module and Entropy-based Uncertainty (EBU) module to get an Explainable Error Mask, which enables the machine teachers/human experts to provide intuitive reasoning behind the results and to solicit feedback to the AI system via an active learning strategy. Such a mechanism bridges the semantic gap between man and machine through collaborative intelligence, where humans and AI actively enhance each other’s complementary strengths. A novel high-confidence sample selection technique based on the DICE similarity coefficient is also presented within the SegXAL framework. Extensive quantitative and qualitative analyses are carried out in the benchmarking Cityscape dataset. Results show the outperformance of our proposed SegXAL against other state-of-the-art models.

arxiv情報

著者 Sriram Mandalika,Athira Nambiar
発行日 2024-08-08 14:19:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.RO パーマリンク