PeRP: Personalized Residual Policies For Congestion Mitigation Through Co-operative Advisory Systems

要約

インテリジェント運転システムを使用すると、簡単な操作で渋滞を緩和できるため、通勤時間やガソリン代などの多くの社会経済的要因が改善されます。
ただし、これらのシステムは自律走行車群を正確に制御することを前提としており、人間の行動の不確実性を考慮していないため、実際には限界があります。
区分定数 (PC) ポリシーは、人間の運転に似た構造をモデル化することでこれらの問題に対処し、密集したシナリオで交通渋滞を緩和し、人間のドライバーが従うべき行動アドバイスを提供します。
ただし、PC ポリシーは、すべてのドライバーが同様に動作することを前提としています。
この目的を達成するために、私たちは、新しいドライバーの特性を条件付けたパーソナライズされた残存ポリシー (PeRP) を備えた PC ポリシーに基づく協同組合助言システムを開発します。
PeRPはドライバーに対し、交通渋滞を緩和する方法で行動するようアドバイスしている。
まず、変分オートエンコーダーを使用して、教師なしの方法でドライバーがどのように指示に従うかについて、ドライバーの本質的な特性を推測します。
次に、推定された特性に基づいて条件付けされたポリシーが PC ポリシーのアクションを適応させて、ドライバーにパーソナライズされた推奨事項を提供します。
私たちのシステムは、指示遵守の新しいドライバー モデリングを使用したシミュレーションでトレーニングされています。
私たちのアプローチは、さまざまなドライバーの行動に適応しながら渋滞を緩和し、ベースラインと比較して平均速度が 4 ~ 22% 向上することを示しています。

要約(オリジナル)

Intelligent driving systems can be used to mitigate congestion through simple actions, thus improving many socioeconomic factors such as commute time and gas costs. However, these systems assume precise control over autonomous vehicle fleets, and are hence limited in practice as they fail to account for uncertainty in human behavior. Piecewise Constant (PC) Policies address these issues by structurally modeling the likeness of human driving to reduce traffic congestion in dense scenarios to provide action advice to be followed by human drivers. However, PC policies assume that all drivers behave similarly. To this end, we develop a co-operative advisory system based on PC policies with a novel driver trait conditioned Personalized Residual Policy, PeRP. PeRP advises drivers to behave in ways that mitigate traffic congestion. We first infer the driver’s intrinsic traits on how they follow instructions in an unsupervised manner with a variational autoencoder. Then, a policy conditioned on the inferred trait adapts the action of the PC policy to provide the driver with a personalized recommendation. Our system is trained in simulation with novel driver modeling of instruction adherence. We show that our approach successfully mitigates congestion while adapting to different driver behaviors, with 4 to 22% improvement in average speed over baselines.

arxiv情報

著者 Aamir Hasan,Neeloy Chakraborty,Haonan Chen,Jung-Hoon Cho,Cathy Wu,Katherine Driggs-Campbell
発行日 2023-08-15 22:31:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, cs.RO パーマリンク