要約
ブロックチェーンコンセンサスのための勾配最適化の証明(POGO)という設計を提示します。ここでは、鉱夫は大規模な機械学習モデルのトレーニングの検証可能な証拠を作成します。
以前の作業に基づいて、Quantized Gradients(4ビット精度)を組み込んでストレージと計算要件を削減しながら、モデルの損失を下げる際に実際の進歩がなされていることを確認する能力を維持します。
さらに、完全な32ビットモデルでマークルプルーフを使用して、大きなパラメーターセットを処理し、最小限のオンチェーンデータでランダムな葉のチェックを有効にします。
これらのアイデアを参照例としてGPT-3(175bパラメーター)を使用して説明し、より小さなが高性能モデル(たとえば、27bパラメーターを備えたGemma〜3)も参照します。
量子化とサンプリングのおかげで、検証がトレーニングよりもかなり安いことを示す経験的コスト分析を提供します。
また、意味のあるトレーニング手順を組み込む際の長いブロック時間(潜在的に時間)の必要性、特殊なGPUハードウェアを使用する際のトレードオフ、およびバイナリdiffが更新を徐々に最適化する方法についても説明します。
最後に、微調整は、データセットとサンプリングの方法を変更するだけでなく、全体的な検証フローを保持するだけで、同様の方法で処理できることに注意してください。
当社のプロトコルにより、検証者は肯定的または否定的な証明を発行できます。
これらは、更新を確認するか、鉱夫を削減するために、最終化時に集約されます。
要約(オリジナル)
We present a design called Proof of Gradient Optimization (PoGO) for blockchain consensus, where miners produce verifiable evidence of training large-scale machine-learning models. Building on previous work, we incorporate quantized gradients (4-bit precision) to reduce storage and computation requirements, while still preserving the ability of verifiers to check that real progress has been made on lowering the model’s loss. Additionally, we employ Merkle proofs over the full 32-bit model to handle large parameter sets and to enable random leaf checks with minimal on-chain data. We illustrate these ideas using GPT-3 (175B parameters) as a reference example and also refer to smaller but high-performance models (e.g., Gemma~3 with 27B parameters). We provide an empirical cost analysis showing that verification is significantly cheaper than training, thanks in part to quantization and sampling. We also discuss the necessity of longer block times (potentially hours) when incorporating meaningful training steps, the trade-offs when using specialized GPU hardware, and how binary diffs may incrementally optimize updates. Finally, we note that fine-tuning can be handled in a similar manner, merely changing the dataset and the manner of sampling but preserving the overall verification flow. Our protocol allows verifiers to issue either positive or negative attestations; these are aggregated at finalization to either confirm the update or slash the miner.
arxiv情報
著者 | José I. Orlicki |
発行日 | 2025-04-23 12:59:42+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google