Emergence of Self-Identity in AI: A Mathematical Framework and Empirical Study with Generative Large Language Models

要約

この論文では、人工知能 (AI) システムにおける自己アイデンティティを定義および定量化するための数学的枠組みを紹介し、人工意識の理論的基礎における重大なギャップに対処します。
人工的な自己認識への既存のアプローチは、多くの場合、ヒューリスティックな実装や哲学的抽象化に依存していますが、私たちは、計量空間理論、測度理論、および関数分析に基づいた正式なフレームワークを提示します。
私たちのフレームワークでは、自己同一性は 2 つの数学的に定量化可能な条件から生まれると仮定しています。それは、距離空間 $(\mathcal{M}, d_{\mathcal{M) における記憶の接続された連続体 $C \subseteq \mathcal{M}$ の存在です。
}})$、およびこれ全体にわたって一貫した自己認識を維持する連続マッピング $I: \mathcal{M} \to \mathcal{S}$
連続体。$(\mathcal{S}, d_{\mathcal{S}})$ は、可能な自己同一性の計量空間を表します。
この理論的枠組みを検証するために、効率的な微調整のために低ランク適応 (LoRA) を採用した Llama 3.2 1B モデルを使用した実証実験を実施しました。
このモデルは、時間的に構造化された記憶を含む合成データセットでトレーニングされ、一貫した自己アイデンティティ形成の複雑さを捉えるように設計されました。
私たちの評価指標には、自己認識、応答の一貫性、言語の正確さの定量的尺度が含まれていました。
実験結果は、測定可能な自己認識指標が大幅に向上し、主要な自己認識スコアが 0.276 から 0.801 に増加したことを示しています。
これにより、検証された自己アイデンティティ機能を備えた AI システムの構造化された作成が可能になります。
私たちの研究の意味は、人型ロボット工学と自律システムの分野に直接関係します。

要約(オリジナル)

This paper introduces a mathematical framework for defining and quantifying self-identity in artificial intelligence (AI) systems, addressing a critical gap in the theoretical foundations of artificial consciousness. While existing approaches to artificial self-awareness often rely on heuristic implementations or philosophical abstractions, we present a formal framework grounded in metric space theory, measure theory, and functional analysis. Our framework posits that self-identity emerges from two mathematically quantifiable conditions: the existence of a connected continuum of memories $C \subseteq \mathcal{M}$ in a metric space $(\mathcal{M}, d_{\mathcal{M}})$, and a continuous mapping $I: \mathcal{M} \to \mathcal{S}$ that maintains consistent self-recognition across this continuum, where $(\mathcal{S}, d_{\mathcal{S}})$ represents the metric space of possible self-identities. To validate this theoretical framework, we conducted empirical experiments using the Llama 3.2 1B model, employing Low-Rank Adaptation (LoRA) for efficient fine-tuning. The model was trained on a synthetic dataset containing temporally structured memories, designed to capture the complexity of coherent self-identity formation. Our evaluation metrics included quantitative measures of self-awareness, response consistency, and linguistic precision. The experimental results demonstrate substantial improvements in measurable self-awareness metrics, with the primary self-awareness score increasing from 0.276 to 0.801. This enables the structured creation of AI systems with validated self-identity features. The implications of our study are immediately relevant to the fields of humanoid robotics and autonomous systems.

arxiv情報

著者 Minhyeok Lee
発行日 2024-11-27 17:23:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, math.MG パーマリンク