TRiSM for Agentic AI: A Review of Trust, Risk, and Security Management in LLM-based Agentic Multi-Agent Systems

要約

大規模な言語モデル(LLM)に基づいて構築され、マルチエージェント構成で展開されたエージェントAIシステムは、企業および社会的領域全体のインテリジェントな自律性、コラボレーション、意思決定を再定義しています。
このレビューでは、LLMベースのエージェントマルチエージェントシステム(AMAS)のコンテキストで、信頼、リスク、およびセキュリティ管理(TRISM)の構造化分析を提示します。
まず、エージェントAIの概念的基盤、従来のAIエージェントとのアーキテクチャの違い、およびスケーラブルなツール使用の自律性を可能にする新しいシステム設計を調べることから始めます。
エージェントAIフレームワークのTRISMは、エージェントLLMのためにコンテキスト化された4つの柱ガバナンス、説明可能性、モデルOps、およびプライバシー/セキュリティを通じて詳細に説明されています。
一意の脅威ベクトルを特定し、実際の脆弱性を示すケーススタディでサポートされているエージェントAIアプリケーションの包括的なリスク分類法を導入します。
さらに、このペーパーでは、分散LLMエージェントシステムにおける信頼構築メカニズム、透明性と監視手法、および最先端の説明戦略も調査します。
さらに、信頼、解釈可能性、および人間中心のパフォーマンスを評価するためのメトリックが、オープンベンチマークの課題とともにレビューされます。
セキュリティとプライバシーは、暗号化、敵対的防衛、および進化するAI規制の遵守を通じて対処されます。
この論文は、責任あるエージェントAIのロードマップで締めくくり、安全、説明責任、および透明な展開のための堅牢なトリスム原理を備えた新しいマルチエージェントシステムを整合するための研究の指示を提案します。

要約(オリジナル)

Agentic AI systems, built on large language models (LLMs) and deployed in multi-agent configurations, are redefining intelligent autonomy, collaboration and decision-making across enterprise and societal domains. This review presents a structured analysis of Trust, Risk, and Security Management (TRiSM) in the context of LLM-based agentic multi-agent systems (AMAS). We begin by examining the conceptual foundations of agentic AI, its architectural differences from traditional AI agents, and the emerging system designs that enable scalable, tool-using autonomy. The TRiSM in the agentic AI framework is then detailed through four pillars governance, explainability, ModelOps, and privacy/security each contextualized for agentic LLMs. We identify unique threat vectors and introduce a comprehensive risk taxonomy for the agentic AI applications, supported by case studies illustrating real-world vulnerabilities. Furthermore, the paper also surveys trust-building mechanisms, transparency and oversight techniques, and state-of-the-art explainability strategies in distributed LLM agent systems. Additionally, metrics for evaluating trust, interpretability, and human-centered performance are reviewed alongside open benchmarking challenges. Security and privacy are addressed through encryption, adversarial defense, and compliance with evolving AI regulations. The paper concludes with a roadmap for responsible agentic AI, proposing research directions to align emerging multi-agent systems with robust TRiSM principles for safe, accountable, and transparent deployment.

arxiv情報

著者 Shaina Raza,Ranjan Sapkota,Manoj Karkee,Christos Emmanouilidis
発行日 2025-06-04 16:26:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク