SourceP: Smart Ponzi Schemes Detection on Ethereum Using Pre-training Model with Data Flow

要約

ブロックチェーン技術の普及に伴い、ブロックチェーン・プラットフォームであるイーサリアムにおいても、典型的な金融詐欺であるポンジ・スキームが出現しています。スマートコントラクトを通じて展開されるこのネズミ講は、スマートポンジスキームとも呼ばれ、多くの経済的損失や悪影響を及ぼしています。Ethereum上のスマートポンジスキームを検出するための既存の方法は、主にスマートコントラクトのバイトコード特徴、オペコード特徴、アカウント特徴、および取引動作特徴に依存しており、そのような方法は解釈可能性と持続性に欠けています。本論文では、スマートコントラクトのソースコードを特徴として使用するだけで、別の方向からスマートポンジスキームを検出する可能性を探ることができる、事前学習モデルとデータフローを用いたEthereumプラットフォーム上のスマートポンジスキームを検出する手法SourcePを提案します。SourcePは、モデルの解釈可能性を高めつつ、既存の検知手法のデータ取得や特徴量抽出の難易度を下げることができます。具体的には、まずスマートコントラクトのソースコードをデータフローグラフに変換し、次にコード表現の学習に基づく事前学習モデルを導入して、スマートコントラクトのポンジスキームを識別するための分類モデルを構築します。実験結果は、SourcePがEthereumのスマートコントラクトデータセット内のスマートポンジスキームを検出するために87.2%の再現率と90.7%のFスコアを達成し、性能と持続性の面で最先端手法を上回ることを示しています。また、追加実験を通じて、事前学習モデルとデータフローがSourcePに重要な貢献を果たすことを示すとともに、SourcePが優れた汎化能力を持つことを証明しました。

要約(オリジナル)

As blockchain technology becomes more and more popular, a typical financial scam, the Ponzi scheme, has also emerged in the blockchain platform Ethereum. This Ponzi scheme deployed through smart contracts, also known as the smart Ponzi scheme, has caused a lot of economic losses and negative impacts. Existing methods for detecting smart Ponzi schemes on Ethereum mainly rely on bytecode features, opcode features, account features, and transaction behavior features of smart contracts, and such methods lack interpretability and sustainability. In this paper, we propose SourceP, a method to detect smart Ponzi schemes on the Ethereum platform using pre-training models and data flow, which only requires using the source code of smart contracts as features to explore the possibility of detecting smart Ponzi schemes from another direction. SourceP reduces the difficulty of data acquisition and feature extraction of existing detection methods while increasing the interpretability of the model. Specifically, we first convert the source code of a smart contract into a data flow graph and then introduce a pre-training model based on learning code representations to build a classification model to identify Ponzi schemes in smart contracts. The experimental results show that SourceP achieves 87.2\% recall and 90.7\% F-score for detecting smart Ponzi schemes within Ethereum’s smart contract dataset, outperforming state-of-the-art methods in terms of performance and sustainability. We also demonstrate through additional experiments that pre-training models and data flow play an important contribution to SourceP, as well as proving that SourceP has a good generalization ability.

arxiv情報

著者 Pengcheng Lu,Liang Cai,Keting Yin
発行日 2023-06-02 16:40:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.SE パーマリンク