Stratified Rule-Aware Network for Abstract Visual Reasoning

要約

抽象的推論とは、情報を分析し、無形のレベルで規則を発見し、革新的な方法で問題を解決する能力を指します。抽象的推論の能力を調べるには、一般的にRaven’s Progressive Matrices (RPM) テストが使用されます。被験者には、RPMの右下にある欠落したパネル(例えば、3ドル×3回の行列)を埋めるために、行列内の基本的な規則に従って、回答セットから正しい選択肢を特定することが求められる。最近の研究では、CNN(Convolutional Neural Networks)を利用して、RPMテストを達成するための心強い進展があった。しかし、CNNはRPMソルバーが必要とする帰納的バイアス、例えば、各行/列における次数感受性やルールの漸進的帰納を部分的に無視している。この問題に対処するため、本論文では、2つの入力系列に対するルール埋め込みを生成する階層型ルールアウェアネットワーク(SRAN)を提案する。我々のSRANは、異なるレベルの複数の粒度のルール埋め込みを学習し、ゲート付き融合モジュールを介して層別埋め込みフローをインクリメンタルに統合する。埋め込みの助けを借りて、ルールの類似性メトリックを適用し、SRANがタプレットロスを使って学習できるだけでなく、効率的に最適解を推論できることを保証する。さらに、RPMテストのための一般的なRAVENデータセットに存在する深刻な欠陥を指摘し、抽象的推論能力の公正な評価の妨げになることを指摘する。この欠陥を修正するために、我々は属性バイセクションツリー(ABT)と呼ばれる解答セット生成アルゴリズムを提案し、Impartial-RAVEN(略称I-RAVEN)と名付けられた改良版データセットを形成する。PGMとI-RAVENの両データセットで広範な実験を行い、我々のSRANが最新モデルをかなりのマージンで凌駕することを示す。

要約(オリジナル)

Abstract reasoning refers to the ability to analyze information, discover rules at an intangible level, and solve problems in innovative ways. Raven’s Progressive Matrices (RPM) test is typically used to examine the capability of abstract reasoning. The subject is asked to identify the correct choice from the answer set to fill the missing panel at the bottom right of RPM (e.g., a 3$\times$3 matrix), following the underlying rules inside the matrix. Recent studies, taking advantage of Convolutional Neural Networks (CNNs), have achieved encouraging progress to accomplish the RPM test. However, they partly ignore necessary inductive biases of RPM solver, such as order sensitivity within each row/column and incremental rule induction. To address this problem, in this paper we propose a Stratified Rule-Aware Network (SRAN) to generate the rule embeddings for two input sequences. Our SRAN learns multiple granularity rule embeddings at different levels, and incrementally integrates the stratified embedding flows through a gated fusion module. With the help of embeddings, a rule similarity metric is applied to guarantee that SRAN can not only be trained using a tuplet loss but also infer the best answer efficiently. We further point out the severe defects existing in the popular RAVEN dataset for RPM test, which prevent from the fair evaluation of the abstract reasoning ability. To fix the defects, we propose an answer set generation algorithm called Attribute Bisection Tree (ABT), forming an improved dataset named Impartial-RAVEN (I-RAVEN for short). Extensive experiments are conducted on both PGM and I-RAVEN datasets, showing that our SRAN outperforms the state-of-the-art models by a considerable margin.

arxiv情報

著者 Sheng Hu,Yuqing Ma,Xianglong Liu,Yanlu Wei,Shihao Bai
発行日 2022-06-07 11:49:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク