要約
抽象的な推論は人工知能アルゴリズムに大きな課題をもたらし、知覚タスクに必要な以上の認知能力を要求します。
この研究では、画像から概念と特徴を個別に抽出するように設計された新しいフレームワークであるクロスフィーチャー ネットワーク (CFN) を紹介します。
このフレームワークは、特に Bongard-Logo 問題に対処する際に、概念に対する特徴の応答を推論の表現として利用します。
CFN 内で抽出された概念と機能の間の期待値最大化プロセスを統合することにより、一定の制限はあるものの、注目すべき結果を達成しました。
これらの制限を克服するために、画像からの特徴抽出を最大化し、Bongard-Logo 問題と Raven の漸進行列 (RPM) 問題の両方で有効性を実証する効率的なモデルである Triple-CFN を提案します。
さらに、RPM 問題に合わせた概念空間を明示的に構築する Triple-CFN の高度なバージョンである Meta Triple-CFN を紹介します。
これにより、関連する概念の推論と解釈の精度が高くなります。
全体として、この研究は抽象的な推論のための革新的なネットワーク設計を探求し、それによってマシン インテリジェンスのフロンティアを前進させます。
要約(オリジナル)
Abstract reasoning poses significant challenges to artificial intelligence algorithms, demanding a cognitive ability beyond that required for perceptual tasks. In this study, we introduce the Cross-Feature Network (CFN), a novel framework designed to separately extract concepts and features from images. This framework utilizes the responses of features to concepts as representations for reasoning, particularly in addressing the Bongard-Logo problem. By integrating an Expectation-Maximization process between the extracted concepts and features within the CFN, we have achieved notable results, albeit with certain limitations. To overcome these limitations, we propose the Triple-CFN, an efficient model that maximizes feature extraction from images and demonstrates effectiveness in both the Bongard-Logo and Raven’s Progressive Matrices (RPM) problems. Furthermore, we introduce Meta Triple-CFN, an advanced version of Triple-CFN, which explicitly constructs a concept space tailored for RPM problems. This ensures high accuracy of reasoning and interpretability of the concepts involved. Overall, this work explores innovative network designs for abstract reasoning, thereby advancing the frontiers of machine intelligence.
arxiv情報
著者 | Ruizhuo Song,Beiming Yuan |
発行日 | 2024-05-20 14:40:54+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google