Blockchain Large Language Models


タイトル: ブロックチェーン大規模言語モデル
– TXRANKというツールは、ブロックチェーン取引の異常をリアルタイムで検出する手法を提供する。
– TXRANKはブロックチェーン活動の追跡表現を生成し、大規模言語モデルをトレーニングして、リアルタイム侵入検知システムとして機能する。
– 従来の方法とは異なり、TXRANKは事前定義されたルールやパターンに依存せず、制限のない検索空間を提供するため、より広範囲の異常を検出できる。
– TXRANKはEthereum取引の異常検出ツールとして使用され、68M取引のデータセットで異常な取引を効果的に識別し、平均2284取引/秒のスループットを示した。
– 私たちの結果は、TXRANKが、被害者契約とやりとりする上位3つの最も異常な取引のうち、攻撃の49件を上位にランキングして異常な取引を特定できることを示している。
– この研究は、トランスフォーマーアーキテクチャに互換性のあるカスタムデータエンコーディング、ドメイン固有のトークナイゼーション技術、およびEthereum仮想マシン(EVM)トレース表現に特化したツリーエンコーディング手法を導入することにより、ブロックチェーントランザクション分析の分野に貢献している。


This paper presents a dynamic, real-time approach to detecting anomalous blockchain transactions. The proposed tool, TXRANK, generates tracing representations of blockchain activity and trains from scratch a large language model to act as a real-time Intrusion Detection System. Unlike traditional methods, TXRANK is designed to offer an unrestricted search space and does not rely on predefined rules or patterns, enabling it to detect a broader range of anomalies. We demonstrate the effectiveness of TXRANK through its use as an anomaly detection tool for Ethereum transactions. In our experiments, it effectively identifies abnormal transactions among a dataset of 68M transactions and has a batched throughput of 2284 transactions per second on average. Our results show that, TXRANK identifies abnormal transactions by ranking 49 out of 124 attacks among the top-3 most abnormal transactions interacting with their victim contracts. This work makes contributions to the field of blockchain transaction analysis by introducing a custom data encoding compatible with the transformer architecture, a domain-specific tokenization technique, and a tree encoding method specifically crafted for the Ethereum Virtual Machine (EVM) trace representation.


著者 Yu Gai,Liyi Zhou,Kaihua Qin,Dawn Song,Arthur Gervais
発行日 2023-04-25 11:56:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.CR, cs.LG パーマリンク