A proof of convergence of inverse reinforcement learning for multi-objective optimization

要約

タイトル:複数目的最適化の逆強化学習の収束の証明

要約:
– 著者らは、Wasserstein逆強化学習(WIRL)を用いて複数目的最適化問題における逆問題を解くことができるということを示した。
– この逆問題は、WIRLによって最適化問題の逆問題を解くことと同じである。
– さらに、原始的なサブグラディエント法を用いた最大エントロピー逆強化学習、ガイドコスト学習による複数目的最適化問題での逆強化学習の収束を証明した。

要約(オリジナル)

We show the convergence of Wasserstein inverse reinforcement learning (WIRL) for multi-objective optimizations with the projective subgradient method by formulating an inverse problem of the optimization problem that is equivalent to WIRL for multi-objective optimizations. In addition, we prove convergence of inverse reinforcement learning (maximum entropy inverse reinforcement learning, guid cost learning) for multi-objective optimization with the projective subgradient method.

arxiv情報

著者 Akira Kitaoka,Riki Eto
発行日 2023-05-10 13:41:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.LG, stat.ML パーマリンク