要約
タイトル:ニューロミメティックシステムのエミュレーション学習
要約:
– ニューロヒューリスティック量子化システムの最近の研究を基に、量子化された動きの学習とチャネルドロップアウトへの耐性の結果を報告している。
– ニューロミメティックのパラダイムに一致する一般的なエミュレーション問題を提案している。
– 最適量子化問題はモデル予測制御(MPC)によって解決できるが、最適化ステップには整数プログラミングが含まれるため、入力チャネルの数が多くなると組み合わせ的複雑性が生じる。
– 同時にニューラルネットワークをトレーニングするためのデータポイントを収集しても、トレーニング自体やトレーニングデータの収集には時間がかかる。
– そのため、トラジェクトリを学習するだけでなく、チャネルドロップアウトへの耐性の利点も示すことができる一般的なDeep Qネットワーク(DQN)アルゴリズムを提案している。
– さらに、モデルを他のエミュレーション問題に転送するためには、現在のモデルに直接マッピングベースの転移学習アプローチを使用して、新しいエミュレーション問題の最適方向を得ることができる。
要約(オリジナル)
Building on our recent research on neural heuristic quantization systems, results on learning quantized motions and resilience to channel dropouts are reported. We propose a general emulation problem consistent with the neuromimetic paradigm. This optimal quantization problem can be solved by model predictive control (MPC), but because the optimization step involves integer programming, the approach suffers from combinatorial complexity when the number of input channels becomes large. Even if we collect data points to train a neural network simultaneously, collection of training data and the training itself are still time-consuming. Therefore, we propose a general Deep Q Network (DQN) algorithm that can not only learn the trajectory but also exhibit the advantages of resilience to channel dropout. Furthermore, to transfer the model to other emulation problems, a mapping-based transfer learning approach can be used directly on the current model to obtain the optimal direction for the new emulation problems.
arxiv情報
著者 | Zexin Sun,John Baillieul |
発行日 | 2023-05-04 22:47:39+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI