Computational Teaching for Driving via Multi-Task Imitation Learning

要約

スポーツやパフォーマンスドライビングのための運動スキルの学習は、多くの場合、専門の人間の教師からの専門的な指導を受けて行われますが、その指導は限られています。
私たちの目標は、人間の教師と同様に生徒と対話する学習済みモデルを介した自動指導を可能にすることです。
ただし、このような自動教育システムのトレーニングは、大規模に収集するのが難しい、専門家の教師と生徒のやり取りに関する高品質の注釈付きデータセットの利用可能性によって制限されます。
このデータ不足の問題に対処するために、マルチタスク模倣学習 (MTIL) パラダイムを介して、高性能運転などの複雑な運動タスクのコーチング システムをトレーニングするアプローチを提案します。
MTIL を使用すると、対象のタスクを実行する人間のより容易に利用可能な非対話型データセットからの自己教師ありトレーニング信号を利用して、モデルが堅牢な表現を学習できるようになります。
私たちは、(1) 実際の人間の運転軌跡から作成された半合成データセット、(2) プロのトラック運転指導データセット、(3) トラックレーシング運転シミュレーターの人間と被験者の研究、(4) システムを使用してアプローチを検証します。
レーストラックでの計装車のデモンストレーション。
私たちの実験では、補助的な機械学習タスクの適切なセットにより、指導命令の予測のパフォーマンスが向上することが示されています。
さらに、人間を対象とした研究では、私たちの教育システムからの指示を受けた生徒は、トラック制限内に留まる能力を向上させ、有用性と満足度の観点から、モデルと生徒の相互作用に好意的な認識を示しています。

要約(オリジナル)

Learning motor skills for sports or performance driving is often done with professional instruction from expert human teachers, whose availability is limited. Our goal is to enable automated teaching via a learned model that interacts with the student similar to a human teacher. However, training such automated teaching systems is limited by the availability of high-quality annotated datasets of expert teacher and student interactions that are difficult to collect at scale. To address this data scarcity problem, we propose an approach for training a coaching system for complex motor tasks such as high performance driving via a Multi-Task Imitation Learning (MTIL) paradigm. MTIL allows our model to learn robust representations by utilizing self-supervised training signals from more readily available non-interactive datasets of humans performing the task of interest. We validate our approach with (1) a semi-synthetic dataset created from real human driving trajectories, (2) a professional track driving instruction dataset, (3) a track-racing driving simulator human-subject study, and (4) a system demonstration on an instrumented car at a race track. Our experiments show that the right set of auxiliary machine learning tasks improves performance in predicting teaching instructions. Moreover, in the human subjects study, students exposed to the instructions from our teaching system improve their ability to stay within track limits, and show favorable perception of the model’s interaction with them, in terms of usefulness and satisfaction.

arxiv情報

著者 Deepak Gopinath,Xiongyi Cui,Jonathan DeCastro,Emily Sumner,Jean Costa,Hiroshi Yasuda,Allison Morgan,Laporsha Dees,Sheryl Chau,John Leonard,Tiffany Chen,Guy Rosman,Avinash Balachandran
発行日 2024-10-02 14:47:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク