要約
自律制御システムは、潜在的なリスクの存在下で複雑なタスクを実行する際に大きな課題に直面しています。
これに対処するために、大規模な言語モデル(LLM)、数値的最適化、最適化ベースの制御を組み合わせた統合フレームワークを提案し、潜在リスクに対する安全性を確保しながら効率的なサブタスク学習を促進します。
このフレームワークは、複雑なタスクを分解して、潜在的なリスクを説明する一連のコンテキスト認識サブタスクに分類されます。
これらのサブタスクとそのパラメーターは、マルチタイムスケールのプロセス、つまり高層マルチターン内学習、中層LLMチェーンの推論と数値的最適化、および低層モデルの予測制御を通じて洗練されます。
このフレームワークは、低層最適化プロセスと物理シミュレーターから定性的フィードバックと最適化された軌道データを活用することにより、意思決定を改善します。
ロボットアームと自律車両シナリオを含むシミュレートされたケーススタディを通じて、提案されたフレームワークを検証します。
実験は、提案されたフレームワークがコンテキストと潜在的なリスクに基づいてアクションを媒介し、複雑な行動を効率的に学ぶことができることを示しています。
要約(オリジナル)
Autonomous control systems face significant challenges in performing complex tasks in the presence of latent risks. To address this, we propose an integrated framework that combines Large Language Models (LLMs), numerical optimization, and optimization-based control to facilitate efficient subtask learning while ensuring safety against latent risks. The framework decomposes complex tasks into a sequence of context-aware subtasks that account for latent risks. These subtasks and their parameters are then refined through a multi-time-scale process: high-layer multi-turn in-context learning, mid-layer LLM Chain-of-Thought reasoning and numerical optimization, and low-layer model predictive control. The framework iteratively improves decisions by leveraging qualitative feedback and optimized trajectory data from lower-layer optimization processes and a physics simulator. We validate the proposed framework through simulated case studies involving robot arm and autonomous vehicle scenarios. The experiments demonstrate that the proposed framework can mediate actions based on the context and latent risks and learn complex behaviors efficiently.
arxiv情報
著者 | Xiyu Deng,Quan Khanh Luu,Anh Van Ho,Yorie Nakahira |
発行日 | 2025-05-06 23:56:25+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google