要約
【タイトル】PyTorchを用いた大規模な選択モデリングのためのTorch-Choice: Pythonパッケージ
【要約】
– $\texttt{torch-choice}$は、PythonとPyTorchを用いた柔軟で高速な選択モデリングのためのオープンソースライブラリである。
– $\texttt{torch-choice}$は、メモリ使用量を効率的に管理するために$\texttt{ChoiceDataset}$データ構造を提供する。
– 著者らは、様々な形式のデータベースから$\texttt{ChoiceDataset}$を構築し、$\texttt{ChoiceDataset}$の機能を紹介している。
– パッケージは、多項ロジットモデルとネステッドロジットモデルの2つの広く使用されているモデルを実装しており、モデル推定中に正則化をサポートする。
– 計算効率を高めるために、パッケージはGPUを利用するオプションを提供しており、コンピュータ効率を維持しながら大規模なデータセットにスケールすることができる。
– モデルは、Rスタイルの式文字列またはPythonの辞書を使用して初期化することができる。
– 著者らは、(1)観測数の増加、(2)共変量数の増加、(3)アイテムセットの拡大の3つの側面から、$\texttt{torch-choice}$とRの$\texttt{mlogit}$の計算効率を比較している。
– 最後に、著者らは大規模なデータセットに対して$\texttt{torch-choice}$が拡張可能であることを示している。
要約(オリジナル)
The $\texttt{torch-choice}$ is an open-source library for flexible, fast choice modeling with Python and PyTorch. $\texttt{torch-choice}$ provides a $\texttt{ChoiceDataset}$ data structure to manage databases flexibly and memory-efficiently. The paper demonstrates constructing a $\texttt{ChoiceDataset}$ from databases of various formats and functionalities of $\texttt{ChoiceDataset}$. The package implements two widely used models, namely the multinomial logit and nested logit models, and supports regularization during model estimation. The package incorporates the option to take advantage of GPUs for estimation, allowing it to scale to massive datasets while being computationally efficient. Models can be initialized using either R-style formula strings or Python dictionaries. We conclude with a comparison of the computational efficiencies of $\texttt{torch-choice}$ and $\texttt{mlogit}$ in R as (1) the number of observations increases, (2) the number of covariates increases, and (3) the expansion of item sets. Finally, we demonstrate the scalability of $\texttt{torch-choice}$ on large-scale datasets.
arxiv情報
著者 | Tianyu Du,Ayush Kanodia,Susan Athey |
発行日 | 2023-04-04 16:00:48+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, OpenAI