要約
この論文は、エージェントのアクションを駆動するおそらく非凸かつ非定常のコストを観察から再構築することを目的とした有限水平逆制御問題に関するものです。
これに関連して、エージェントコストがそうでなく、基礎となるダイナミクスが非線形、非定常、確率的である場合でも、凸状の最適化問題を解くことによってコストの再構築を可能にする結果を提示します。
この結果を得るために、ランダム化されたポリシーを決定変数として持つ有限水平フォワード制御問題も研究します。
私たちは発見をアルゴリズム手順に変換し、インシリコおよびハードウェア検証を通じてアプローチの有効性を示します。
すべての実験により、私たちのアプローチの有効性が確認されています。
要約(オリジナル)
This paper is concerned with a finite-horizon inverse control problem, which has the goal of reconstructing, from observations, the possibly non-convex and non-stationary cost driving the actions of an agent. In this context, we present a result enabling cost reconstruction by solving an optimization problem that is convex even when the agent cost is not and when the underlying dynamics is nonlinear, non-stationary and stochastic. To obtain this result, we also study a finite-horizon forward control problem that has randomized policies as decision variables. We turn our findings into algorithmic procedures and show the effectiveness of our approach via in-silico and hardware validations. All experiments confirm the effectiveness of our approach.
arxiv情報
著者 | Emiland Garrabe,Hozefa Jesawada,Carmen Del Vecchio,Giovanni Russo |
発行日 | 2024-06-26 17:59:37+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google