The Dilemma of Choice: Addressing Constraint Selection for Autonomous Robotic Agents

要約

自律エージェントが実行することが期待されるタスクは、多くの場合、オプションであるか、エージェントの限定された作動能力、特にダイナミクスと制御入力の境界により互いに互換性がありません。
私たちはタスクを時間依存の状態制約としてエンコードし、多目的最適化の進歩を活用して、常に満たすことができ、パフォーマンス指標を最大化する実現可能な制約のサブセットの選択としてタスクを選択する問題を定式化します。
この問題は、オフライン段階での到達可能性または混合整数モデルの予測制御ベースの分析には適していますが、一般に NP 困難であり、したがって効率的に解決するにはヒューリスティックが必要であることを示します。
最適化問題の各タイム ステップでタスク制約を課す特定のポリシーの下で制約の非互換性が観察された場合、互換性のある期間にわたる対応するラグランジュ乗数の変化に基づいて、これらの制約のそれぞれにラグランジュ スコアを割り当てます。
これらのスコアは、貪欲戦略で制約を削除する順序を決定するために使用されます。
さらに、遺伝的アルゴリズムを使用して、貪欲な戦略を改善します。
状態制約を課す低レベルのコントローラーがコントロール バリア関数ベースの二次計画法で記述されている場合に、タスクに従うロボットのウェイポイントでメソッドを評価し、後方到達可能なセットの知識に基づくウェイポイント選択との比較を提供します。

要約(オリジナル)

The tasks that an autonomous agent is expected to perform are often optional or are incompatible with each other owing to the agent’s limited actuation capabilities, specifically the dynamics and control input bounds. We encode tasks as time-dependent state constraints and leverage the advances in multi-objective optimization to formulate the problem of choosing tasks as selection of a feasible subset of constraints that can be satisfied for all time and maximizes a performance metric. We show that this problem, although amenable to reachability or mixed integer model predictive control-based analysis in the offline phase, is NP-Hard in general and therefore requires heuristics to be solved efficiently. When incompatibility in constraints is observed under a given policy that imposes task constraints at each time step in an optimization problem, we assign a Lagrange score to each of these constraints based on the variation in the corresponding Lagrange multipliers over the compatible time horizon. These scores are then used to decide the order in which constraints are dropped in a greedy strategy. We further employ a genetic algorithm to improve upon the greedy strategy. We evaluate our method on a robot waypoint following task when the low-level controllers that impose state constraints are described by Control Barrier Function-based Quadratic Programs and provide a comparison with waypoint selection based on knowledge of backward reachable sets.

arxiv情報

著者 Hardik Parwana,Ruiyang Wang,Dimitra Panagou
発行日 2023-05-18 14:41:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO, math.OC パーマリンク