Image Transformation Sequence Retrieval with General Reinforcement Learning

要約

この研究では、新しい画像変換シーケンス取得 (ITSR) タスクが提示されます。このタスクでは、モデルは、それぞれソースとターゲットとして機能する 2 つの指定された画像間の変換シーケンスを取得する必要があります。
正しいシーケンスの多重度やプロセスの連続ステップ間の相関関係などの課題の特定の特性を考慮して、モンテカルロ木探索 (MCTS) などの一般的なモデルベースの強化学習を使用した ITSR のソリューションを提案します。
ディープニューラルネットワークと組み合わせます。
私たちの実験は、提案されたアプローチが教師ありトレーニングと比較される、合成ドメインと実際のドメインの両方のベンチマークを提供します。
結果は、MCTS でトレーニングされたモデルが、最も単純なケースと最も複雑なケースの両方で、教師ありモデルよりも優れたパフォーマンスを発揮できることを報告しています。
私たちの研究は、ITSR の性質とそれに関連する課題について興味深い結論を導き出しました。

要約(オリジナル)

In this work, the novel Image Transformation Sequence Retrieval (ITSR) task is presented, in which a model must retrieve the sequence of transformations between two given images that act as source and target, respectively. Given certain characteristics of the challenge such as the multiplicity of a correct sequence or the correlation between consecutive steps of the process, we propose a solution to ITSR using a general model-based Reinforcement Learning such as Monte Carlo Tree Search (MCTS), which is combined with a deep neural network. Our experiments provide a benchmark in both synthetic and real domains, where the proposed approach is compared with supervised training. The results report that a model trained with MCTS is able to outperform its supervised counterpart in both the simplest and the most complex cases. Our work draws interesting conclusions about the nature of ITSR and its associated challenges.

arxiv情報

著者 Enrique Mas-Candela,Antonio Ríos-Vila,Jorge Calvo-Zaragoza
発行日 2023-07-13 08:56:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク