ZK Rollup 目前不支持 EVM,zkEVM 选择直接支持 EVM 指令集,并兼容 Solidity 指令集。

原文标题:《zkEVM - Hermez 设计思路》
撰文:Star Li

了解 Layer2 技术现状(特别是对 zk Rollup 技术)的小伙伴,知道 zk Rollup 目前不支持 EVM,缺失可编程性 / 可组合性,让 zk Rollup 限制在特定场景。zkEVM,通过 zkp 技术证明 EVM 的执行过程是非常有挑战的技术难点。

EthCC 4 会议上 Hermez 团队 介绍 了他们对 zkEVM 的理解和设计。

Hermez 团队负责人 Jordi Baylina 比较清晰地给出了 zkEVM 大体的设计思路。本文梳理一下对 zkEVM 设计的理解。

虚拟机证明

Jordi 在演讲开头提出:The Ethereum Virtual Machine was not designed to run in a zk-circuit (以太坊虚拟机在设计时并没有考虑 zk 电路证明)。也就是说,zkEVM 天生比较难。当初设计 EVM 的时候并没有考虑到后期还需要 zk 进行证明。在这种情况下,目前有三条路可以走:

技术解读以太坊二层扩容方案 Hermez 的 zkEVM 设计思路

第一条:从头设计一种新的虚拟机,该虚拟机对 zk 友好,方便证明。不需要理会 EVM。

第二条:从头设计一种新的虚拟机,该虚拟机对 zk 友好,方便证明。适配当前的 EVM 的开发工具,保持 solidity 兼容。

第三条:直接支持 EVM 指令集,完全兼容 solidity 指令集。

Hermez 团队选择了第三条。其他两种做法在当前的环境下,不太经济。Hermez 给出了选择第三条路的理由:

技术解读以太坊二层扩容方案 Hermez 的 zkEVM 设计思路

总的来说,就是兼容性好,安全性高。

总体思路

因为 EVM 在设计当初没有考虑 zk 电路证明,支持 solidity 指令集需要引入中间指令(micro opcode)。这些中间指令比较适合电路证明。这些指令构成 uVM。EVM 需要编译在 uVM 中执行。

技术解读以太坊二层扩容方案 Hermez 的 zkEVM 设计思路

众所周知,EVM 有一些变长的指令,比如 CALL,DATACOPY,EXP,CREATE 等等。这些指令天生对电路证明不友好。利用中间指令能相对友好地“表达”出这些指令的逻辑。

对于一个区块中的所有交易,相关的指令可以一个个的执行。执行的模型是:老的状态 + 所有交易指令 -> 新的状态。一个细节是状态的迁移是以区块为单位,并不是以交易为单位的。

多项式承诺

在继续解释细节实现之前,Jordi 简单介绍了一下多项式承诺。多项式有两种表示方式:1/ 系数表示 2/ 点值表示。

技术解读以太坊二层扩容方案 Hermez 的 zkEVM 设计思路

在给定一个多项式承诺(cm)的情况下,验证者可以提供随机挑战 r,证明者必须给出多项式在 r 的取值以及承诺证明。随机挑战值 r,可以通过 Fiat-Shamir 算法产生,将交互式的协议变成非交互式协议。在给出多个多项式承诺证明的前提下,通过取值的关系可以确定多项式之间的关系。通过多项式承诺可以证明如下的多项式关系:

技术解读以太坊二层扩容方案 Hermez 的 zkEVM 设计思路

技术解读以太坊二层扩容方案 Hermez 的 zkEVM 设计思路

多项式相等,多项式取值等等。熟悉 Plonk 或者 Plookup 协议的小伙伴应该知道,这些协议的基础就是多项式承诺。

uVM 的整体框架

uVM 由如下的模块组成:ROM,RAM,Storage 以及各种计算功能模块。Main SM (主状态机)由子模块组成。

技术解读以太坊二层扩容方案 Hermez 的 zkEVM 设计思路

需要证明程序的执行状态正确,要保证如下的一些状态正确:

如何证明执行程序正确?

执行程序存储在 ROM 中。将指令和位置进行编码后,得到执行程序的多项式表示 rom (x)。将 Main SM 中的代码执行指令和 PC 进行同样的编码后形成的多项式 instTrace(x)。无论这份代码如何执行(循环的次数,跳转方式),instTrace(x) 中的元素都应该属于 rom(x)。这种从属关系可以采用 Plookup 协议进行证明。

技术解读以太坊二层扩容方案 Hermez 的 zkEVM 设计思路

注意的是,instTrace 指的是执行实例的 Trace。虽然,通过 Plookup 能证明 instTrace(x) 中的元素属于 rom(x),但是 instTrace(x) 的执行正确性并没有证明。试想一下 instTrace 中少一两条指令,同样满足从属关系。简单的说,这种从属证明只是证明了 Main SM 和 ROM 状态的一致性。

内存状态正确?

在 Main SM 中的内存的读写情况,应该和内存 RAM 的状态一致。这种一致也是通过 Plookup 协议进行证明。

技术解读以太坊二层扩容方案 Hermez 的 zkEVM 设计思路

内存 RAM 本身逻辑是否正确需要额外证明。

存储状态正确?

uVM 的存储是通过 key-value 对实现。所有存储(key-value 对)用 merkle 树进行组织。所以,存储模块包括 merkle 树和 hash 计算。Plookup 协议可以证明多个模块之间的一致性。

技术解读以太坊二层扩容方案 Hermez 的 zkEVM 设计思路

整体证明构成

一个程序的执行状态的正确性分割成多个子模块的状态正确性验证。总之,证明包括两部分:1/ 单个模块的逻辑正确 2/ 模块和模块之间的一致性。

技术解读以太坊二层扩容方案 Hermez 的 zkEVM 设计思路

证明大量采用多项式承诺。验证这些多项式承诺需要不小的开销。Jordi 提出了多种验证思路:

技术解读以太坊二层扩容方案 Hermez 的 zkEVM 设计思路

第一种:多个 Kate 多项式承诺在链上验证。

第二种:多个 Kate 多项式承诺通过 Plonk 电路验证(配对还是在链上验证)。

第三种:多个 Stark 多项式承诺通过 Plonk 或者 Groth16 电路进行验证。

总结

EVM 在设计时并没有考虑到 zk 电路证明。Hermez 提出了 uVM 框架和指令集。作为中间指令集,方便 zk 电路证明,同时可以实现 solidity 指令集。一个程序的执行正确性分割成多个子模块状态的正确性。证明包括单个模块状态的正确性以及模块和模块之间的一致性。为了减少众多的证明单独在链上验证,可以采用电路验证。