Collectionless Artificial Intelligence

要約

概して、膨大なデータ収集を専門的に処理することは、機械学習の進歩と関連分野における目覚ましい成果の基本要素とみなされており、そのようなデータ収集の一元化に関連するリスクについての合意が高まっています。
この論文は、環境との相互作用を中心とした真に人間に近い状況において、機械が認知スキルを克服する新しい学習プロトコルを考える時期が来たという立場を支持しています。
これには、コレクションレス原則に従った学習プロトコルに対する特定の制限が伴います。コレクションレス原則では、環境から取得されたデータは、環境の現在の内部表現の更新に寄与する目的で各時点で処理され、エージェントは
時間ストリームを記録する特権は与えられません。
基本的に、センサーからの一時情報を保存する許可はありません。そのため、オフライン学習アルゴリズムに典型的な学習ダイナミクスをシミュレートするために裸のストレージに依存する代わりに、より抽象的なレベルで自己組織化された記憶スキルの開発が促進されます。
この意図的に極端な位置は、人間ベースのスキームに従って動的に情報を整理することを学習するマシンの開発を刺激することを目的としています。
この課題の提案は、学習と推論の計算プロセスに関する新しい基盤を開発することを示唆しており、これにより、設計によりデータの蓄積を回避する AI テクノロジーにおける真に直交的な競争路線への扉が開かれる可能性があり、これによりプライバシー問題や管理に関してより適したフレームワークが提供される可能性があります。
そしてカスタマイズ性。
最後に、大規模分散コンピューティングを推進する AI へのコレクションレスなアプローチにより、企業や政府への権力の集中が軽減され、地政学的な問題にうまく対処できるようになるでしょう。

要約(オリジナル)

By and large, the professional handling of huge data collections is regarded as a fundamental ingredient of the progress of machine learning and of its spectacular results in related disciplines, with a growing agreement on risks connected to the centralization of such data collections. This paper sustains the position that the time has come for thinking of new learning protocols where machines conquer cognitive skills in a truly human-like context centered on environmental interactions. This comes with specific restrictions on the learning protocol according to the collectionless principle, which states that, at each time instant, data acquired from the environment is processed with the purpose of contributing to update the current internal representation of the environment, and that the agent is not given the privilege of recording the temporal stream. Basically, there is neither permission to store the temporal information coming from the sensors, thus promoting the development of self-organized memorization skills at a more abstract level, instead of relying on bare storage to simulate learning dynamics that are typical of offline learning algorithms. This purposely extreme position is intended to stimulate the development of machines that learn to dynamically organize the information by following human-based schemes. The proposition of this challenge suggests developing new foundations on computational processes of learning and reasoning that might open the doors to a truly orthogonal competitive track on AI technologies that avoid data accumulation by design, thus offering a framework which is better suited concerning privacy issues, control and customizability. Finally, pushing towards massively distributed computation, the collectionless approach to AI will likely reduce the concentration of power in companies and governments, thus better facing geopolitical issues.

arxiv情報

著者 Marco Gori,Stefano Melacci
発行日 2023-09-13 13:20:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CY, cs.LG パーマリンク