Exploration in Knowledge Transfer Utilizing Reinforcement Learning

要約

この寄稿では、知識伝達のタスクにおける探索の問題に焦点を当てています。
知識の伝達とは、ソース タスクの学習中に得られた知識をターゲット タスクに有用に適用することを指します。
知識伝達の目的は、対象タスクの学習プロセスをスピードアップすることです。
この記事は、深層転移学習アルゴリズム、特に Deep Target Transfer $Q$-learning 内で使用されるいくつかの探索手法を比較することを目的としています。
使用される手法は、$\epsilon$-greedy、Boltzmann、および上限信頼境界探索です。
前述の転移学習アルゴリズムと探索方法は、仮想ドローン問題でテストされました。
結果は、信頼限界アルゴリズムの上限がこれらのオプションの中で最も優れたパフォーマンスを発揮することを示しています。
他の用途への持続可能性を確認する必要があります。

要約(オリジナル)

The contribution focuses on the problem of exploration within the task of knowledge transfer. Knowledge transfer refers to the useful application of the knowledge gained while learning the source task in the target task. The intended benefit of knowledge transfer is to speed up the learning process of the target task. The article aims to compare several exploration methods used within a deep transfer learning algorithm, particularly Deep Target Transfer $Q$-learning. The methods used are $\epsilon$-greedy, Boltzmann, and upper confidence bound exploration. The aforementioned transfer learning algorithms and exploration methods were tested on the virtual drone problem. The results have shown that the upper confidence bound algorithm performs the best out of these options. Its sustainability to other applications is to be checked.

arxiv情報

著者 Adam Jedlička,Tatiana Valentine Guy
発行日 2024-07-15 15:45:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク