Learning Representative Trajectories of Dynamical Systems via Domain-Adaptive Imitation

要約

タイトル:ドメイン適応型の模倣による動的システムの代表的な軌跡の学習

要約:

・ヒトや動物が、移動する獲物を追跡しながら、動的情報を別のドメインにマッピングするドメイン適応型軌跡模倣がある
・このスキルを持った知的エージェントは、代表的な軌跡を模倣することを学び、交通の異常な動きを認識するなど、多様なタスクに活用できる。
・DATIという深層強化学習エージェントを提案し、サイクル一貫性のある生成的対抗ネットワーク法を使用して、ドメイン適応型軌跡模倣のデザインを行う。
・人工的な様々な参照軌跡の家族での実験の結果、DATIは基本的な模倣学習と最適制御に比べて優れた性能を発揮した。
・同じパラメータで、DATIは実世界の異常な動き模式の発見によって、海上交通において一般化され、空間的に拘束されない軌跡データマイニングに対する深層強化学習法の使用の道を開く。

要約(オリジナル)

Domain-adaptive trajectory imitation is a skill that some predators learn for survival, by mapping dynamic information from one domain (their speed and steering direction) to a different domain (current position of the moving prey). An intelligent agent with this skill could be exploited for a diversity of tasks, including the recognition of abnormal motion in traffic once it has learned to imitate representative trajectories. Towards this direction, we propose DATI, a deep reinforcement learning agent designed for domain-adaptive trajectory imitation using a cycle-consistent generative adversarial method. Our experiments on a variety of synthetic families of reference trajectories show that DATI outperforms baseline methods for imitation learning and optimal control in this setting, keeping the same per-task hyperparameters. Its generalization to a real-world scenario is shown through the discovery of abnormal motion patterns in maritime traffic, opening the door for the use of deep reinforcement learning methods for spatially-unconstrained trajectory data mining.

arxiv情報

著者 Edgardo Solano-Carrillo,Jannis Stoppe
発行日 2023-04-19 15:53:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク