要約
アクションの安全性を判断するには、アクションが行われるコンテキストの知識が必要です。
さまざまな文脈で行動する人間のエージェントにとって、これは明らかなように思えるかもしれません。電子メールの削除などのアクションを実行することは、電子メールのコンテンツ、目標(たとえば、機密電子メールを消去したり、ゴミをクリーンアップするため)、電子メールアドレスの種類(仕事や個人)の種類に応じて適切である場合があります。
人とは異なり、計算システムは、限られたコンテキストでの機関しか限られていませんでした。
したがって、手動で作成されたポリシーとユーザーの確認(たとえば、スマートフォンアプリの許可またはネットワークアクセス制御リストなど)は、不完全ですが、有害なアクションを制限するのに十分です。
ただし、多数のタスク(自動化されたパーソナルアシスタントなど)をサポートするジェネラリストエージェントの今後の展開により、これらのシステムのコンテキストと機能の規模に適応するためにセキュリティデザインを再考する必要があると主張します。
最初のステップとして、このペーパーでは、エージェントのドメインのコンテキストセキュリティを調査し、コンテキストエージェントセキュリティ(ConsecA)を提案します。
要約(オリジナル)
Judging an action’s safety requires knowledge of the context in which the action takes place. To human agents who act in various contexts, this may seem obvious: performing an action such as email deletion may or may not be appropriate depending on the email’s content, the goal (e.g., to erase sensitive emails or to clean up trash), and the type of email address (e.g., work or personal). Unlike people, computational systems have often had only limited agency in limited contexts. Thus, manually crafted policies and user confirmation (e.g., smartphone app permissions or network access control lists), while imperfect, have sufficed to restrict harmful actions. However, with the upcoming deployment of generalist agents that support a multitude of tasks (e.g., an automated personal assistant), we argue that we must rethink security designs to adapt to the scale of contexts and capabilities of these systems. As a first step, this paper explores contextual security in the domain of agents and proposes contextual agent security (Conseca), a framework to generate just-in-time, contextual, and human-verifiable security policies.
arxiv情報
著者 | Lillian Tsai,Eugene Bagdasarian |
発行日 | 2025-04-17 17:48:53+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google