An Interpretable Machine Learning Framework to Understand Bikeshare Demand before and during the COVID-19 Pandemic in New York City

要約

近年、自転車シェアリングシステムは、手頃な価格で持続可能なマイクロモビリティソリューションとしてますます人気が高まっています。
バイクシェアの需要を適切に予測するには、機械学習などの高度な数学モデルが必要です。
この目的を達成するために、この研究では、大規模な自転車シェアリング システムにおける時間当たりの需要を推定するための機械学習モデリング フレームワークを提案します。
2 つの Extreme Gradient Boosting モデルが開発されました。1 つは、新型コロナウイルス感染症のパンデミック以前 (2019 年 3 月から 2020 年 2 月) のデータを使用し、もう 1 つはパンデミック中 (2020 年 3 月から 2021 年 2 月) のデータを使用しました。
さらに、SHapley Additive exPlanations に基づくモデル解釈フレームワークが実装されました。
この研究で考慮された説明変数の相対的な重要性に基づくと、女性ユーザーの割合と時間帯が両方のモデルの 2 つの最も重要な説明変数でした。
ただし、月変数はパンデミック前のモデルよりもパンデミック後のモデルでより重要でした。

要約(オリジナル)

In recent years, bikesharing systems have become increasingly popular as affordable and sustainable micromobility solutions. Advanced mathematical models such as machine learning are required to generate good forecasts for bikeshare demand. To this end, this study proposes a machine learning modeling framework to estimate hourly demand in a large-scale bikesharing system. Two Extreme Gradient Boosting models were developed: one using data from before the COVID-19 pandemic (March 2019 to February 2020) and the other using data from during the pandemic (March 2020 to February 2021). Furthermore, a model interpretation framework based on SHapley Additive exPlanations was implemented. Based on the relative importance of the explanatory variables considered in this study, share of female users and hour of day were the two most important explanatory variables in both models. However, the month variable had higher importance in the pandemic model than in the pre-pandemic model.

arxiv情報

著者 Majbah Uddin,Ho-Ling Hwang,Md Sami Hasnine
発行日 2023-11-10 15:24:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク