Logic interpretations of ANN partition cells

要約

フィードフォワード人工ニューラル ネットワーク (ANN) を使用して解決されるバイナリ分類問題を考えてみましょう。
ANN を ReLU 層といくつかの線形層 (畳み込み、合計プーリング、または完全接続) で構成するとします。
ネットワークは高精度でトレーニングされたと仮定します。
数多くのアプローチが提案されているにもかかわらず、人工ニューラル ネットワークを解釈することは人間にとって依然として困難です。
新しい解釈方法として、単純な ANN とロジックの間にブリッジを構築します。
その結果、強力なロジック ツール セットを使用して、ANN のセマンティクスを分析および操作できるようになります。
これを達成するために、ANN の入力空間をいくつかのネットワーク パーティション セルに分解します。
各ネットワーク パーティション セルは、入力値を分類出力値にマッピングする線形結合を表します。
論理式を使用してパーティション セルの線形マップを解釈するには、単純な ANN の入力として minterm 値を使用することをお勧めします。
1 に分類されたオブジェクトと 0 に分類されたオブジェクトを分離するための相互作用パターンを表す論理式を導出します。論理式の解釈を容易にするために、論理式をバイナリ論理ツリーとして表します。

要約(オリジナル)

Consider a binary classification problem solved using a feed-forward artificial neural network (ANN). Let the ANN be composed of a ReLU layer and several linear layers (convolution, sum-pooling, or fully connected). We assume the network was trained with high accuracy. Despite numerous suggested approaches, interpreting an artificial neural network remains challenging for humans. For a new method of interpretation, we construct a bridge between a simple ANN and logic. As a result, we can analyze and manipulate the semantics of an ANN using the powerful tool set of logic. To achieve this, we decompose the input space of the ANN into several network partition cells. Each network partition cell represents a linear combination that maps input values to a classifying output value. For interpreting the linear map of a partition cell using logic expressions, we suggest minterm values as the input of a simple ANN. We derive logic expressions representing interaction patterns for separating objects classified as 1 from those classified as 0. To facilitate an interpretation of logic expressions, we present them as binary logic trees.

arxiv情報

著者 Ingo Schmitt
発行日 2024-08-26 14:43:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LO, F.4.1 パーマリンク