Forecasting the movements of Bitcoin prices: an application of machine learning algorithms


ビットコインなどの暗号通貨は、今日の金融システムにおいて最も物議を醸す複雑な技術革新の 1 つです。
この目的のために、ロジスティック回帰に加えて、4 つの異なる機械学習 (ML) アルゴリズム、つまり、サポート ベクター マシン (SVM)、人工ニューラル ネットワーク (ANN)、単純ベイズ (NB)、およびランダム フォレスト (RF) が適用されます。
アルゴリズム性能の評価には、F 統計、精度統計、平均絶対誤差 (MAE)、二乗平均平方根誤差 (RMSE)、および二乗平均平方根誤差 (RAE) メトリックが使用されました。
t 検定を使用して、SVM、ANN、NB、および RF のパフォーマンスを LR のパフォーマンスと比較しました。
経験的な調査結果によると、RF は連続データセットで最高の予測パフォーマンスを示しますが、NB は最低です。
一方、離散データセットでは、ANN のパフォーマンスが最高で、NB のパフォーマンスが最低です。
さらに、離散データセットは、推定されたすべてのアルゴリズム (モデル) で全体的な予測パフォーマンスを向上させます。


Cryptocurrencies, such as Bitcoin, are one of the most controversial and complex technological innovations in today’s financial system. This study aims to forecast the movements of Bitcoin prices at a high degree of accuracy. To this aim, four different Machine Learning (ML) algorithms are applied, namely, the Support Vector Machines (SVM), the Artificial Neural Network (ANN), the Naive Bayes (NB) and the Random Forest (RF) besides the logistic regression (LR) as a benchmark model. In order to test these algorithms, besides existing continuous dataset, discrete dataset was also created and used. For the evaluations of algorithm performances, the F statistic, accuracy statistic, the Mean Absolute Error (MAE), the Root Mean Square Error (RMSE) and the Root Absolute Error (RAE) metrics were used. The t test was used to compare the performances of the SVM, ANN, NB and RF with the performance of the LR. Empirical findings reveal that, while the RF has the highest forecasting performance in the continuous dataset, the NB has the lowest. On the other hand, while the ANN has the highest and the NB the lowest performance in the discrete dataset. Furthermore, the discrete dataset improves the overall forecasting performance in all algorithms (models) estimated.


著者 Hakan Pabuccu,Serdar Ongan,Ayse Ongan
発行日 2023-03-08 15:01:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.LG, q-fin.CP パーマリンク