cito: An R package for training neural networks using torch

要約

ディープ ニューラル ネットワーク (DNN) は、エコロジーの中心的な手法となっています。
現在の深層学習 (DL) アプリケーションのほとんどは、主要な深層学習フレームワークの 1 つ (特に、Torch または TensorFlow) に依存して DNN を構築およびトレーニングします。
ただし、これらのフレームワークを使用するには、R 環境での一般的な回帰関数よりも大幅に多くの経験と時間が必要です。
ここでは、多くの R パッケージで使用されている使い慣れた数式構文で DNN を指定できる、ユーザーフレンドリーな DL 用 R パッケージ「cito」を紹介します。
モデルを適合させるために、「cito」は「torch」を使用し、数値的に最適化されたトーチ ライブラリを利用します。これには、CPU またはグラフィックス プロセッシング ユニット (GPU) でトレーニング モデルを切り替える機能が含まれます (これにより、大規模な DNN を効率的にトレーニングできます)。

さらに、「cito」には、予測用のブートストラップに基づくオプションの信頼区間 (CI) や、効果の大きさと CI と p 値による変数の重要性の説明可能な AI (xAI) メトリクスを含む、モデルのプロットと分析のための使いやすい機能が多数含まれています。
トレーニング済み DNN を探索するための組み込み xAI 機能を含む、「cito」を使用した典型的な分析パイプラインを紹介するために、アフリカゾウの種分布モデルを構築します。
DNN を指定、デプロイ、解釈するためのユーザーフレンドリーな R フレームワークを提供することで、「cito」がこの興味深いモデル クラスを生態学的データ分析にさらに利用しやすくすることを期待しています。
「cito」の安定バージョンは、包括的な R アーカイブ ネットワーク (CRAN) からインストールできます。

要約(オリジナル)

Deep Neural Networks (DNN) have become a central method in ecology. Most current deep learning (DL) applications rely on one of the major deep learning frameworks, in particular Torch or TensorFlow, to build and train DNN. Using these frameworks, however, requires substantially more experience and time than typical regression functions in the R environment. Here, we present ‘cito’, a user-friendly R package for DL that allows specifying DNNs in the familiar formula syntax used by many R packages. To fit the models, ‘cito’ uses ‘torch’, taking advantage of the numerically optimized torch library, including the ability to switch between training models on the CPU or the graphics processing unit (GPU) (which allows to efficiently train large DNN). Moreover, ‘cito’ includes many user-friendly functions for model plotting and analysis, including optional confidence intervals (CIs) based on bootstraps for predictions and explainable AI (xAI) metrics for effect sizes and variable importance with CIs and p-values. To showcase a typical analysis pipeline using ‘cito’, including its built-in xAI features to explore the trained DNN, we build a species distribution model of the African elephant. We hope that by providing a user-friendly R framework to specify, deploy and interpret DNN, ‘cito’ will make this interesting model class more accessible to ecological data analysis. A stable version of ‘cito’ can be installed from the comprehensive R archive network (CRAN).

arxiv情報

著者 Christian Amesoeder,Florian Hartig,Maximilian Pichler
発行日 2024-01-24 13:24:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, I.5.4 パーマリンク