Characterizing AI Agents for Alignment and Governance

要約

AIエージェントに効果的なガバナンスメカニズムを作成するには、コアプロパティと、これらのプロパティが世界のエージェントの展開と運用を取り巻く質問にどのように関連するかをより深く理解する必要があります。
このペーパーでは、自律性、有効性、目標の複雑さ、一般性の4つの側面に焦点を当てたAIエージェントの特性評価を提供します。
各次元に異なるグラデーションを提案し、各ディメンションがこれらのシステムの設計、操作、ガバナンスに関するユニークな質問を提起すると主張します。
さらに、このフレームワークを利用して、さまざまな種類のAIエージェントの「エージェントプロファイル」を構築します。
これらのプロファイルは、狭いタスク固有のアシスタントから高度に自律的な汎用システムに至るまで、さまざまなクラスのAIエージェントによってもたらされるクロスカットの技術的および非技術的ガバナンスの課題を照らすのに役立ちます。
バリエーションと継続性の重要な軸をマッピングすることにより、このフレームワークは、開発者、政策立案者、および一般の人々に、集合的な社会的目標とより適合するガバナンスアプローチを開発する機会を提供します。

要約(オリジナル)

The creation of effective governance mechanisms for AI agents requires a deeper understanding of their core properties and how these properties relate to questions surrounding the deployment and operation of agents in the world. This paper provides a characterization of AI agents that focuses on four dimensions: autonomy, efficacy, goal complexity, and generality. We propose different gradations for each dimension, and argue that each dimension raises unique questions about the design, operation, and governance of these systems. Moreover, we draw upon this framework to construct ‘agentic profiles’ for different kinds of AI agents. These profiles help to illuminate cross-cutting technical and non-technical governance challenges posed by different classes of AI agents, ranging from narrow task-specific assistants to highly autonomous general-purpose systems. By mapping out key axes of variation and continuity, this framework provides developers, policymakers, and members of the public with the opportunity to develop governance approaches that better align with collective societal goals.

arxiv情報

著者 Atoosa Kasirzadeh,Iason Gabriel
発行日 2025-04-30 17:55:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CY, cs.SY, eess.SY パーマリンク