a16z 为何会青睐去中心化存储项目 Arweave?它的设计理念和经济模型逻辑有何特别之处?弱势与挑战在哪?

作者:Evaluape

去中心化存储项目 Arweave 主打收取一次费用永久储存的概念,希望解决假消息对现实世界的影响。

优势:

1、主打的概念有一定需求场景,技术和激励模型设计的逻辑自洽。
2、产品已经完成开发,向后兼容 IPFS,能够从 Filecoin 上线的热潮获取一部分用户。
3、背后的投资机构顶级,能够带来很多的相应资源。

缺点:

1、目前节点数量较少,激励和节点运营成本匹配的结果是用户的开销较高。
2、需求场景大部分为 B 端,需要长时间试错,合作难度较大。
3、目前几乎无生态,属于小众的游戏。

行业(8 分)

一般来说,互联网上的存储都是有时效性的,比如说我们去搜索 2010 年以前的视频,很大概率会发现已经被视频网站下架。这是因为无论是储存视频在浏览器还是在云上都是有成本的,一旦长时间没有用户浏览,就会被下架。而我们现实生活中的一些重要文档,无一不是存储在本地服务器或者干脆不上传到网络,采用物理方法保存。

一方面是怕被攻击,另一方面是因为存储成本较高。试想将人类文明从古至今的文明都存储在互联网上,那么得耗费多大的储存空间?1996 年由 Alexa 创始人创立过一个非营利网站叫做互联网档案馆,提供数字数据如网站、音乐、动态图像、和数百万书籍的永久性免费存储及获取。到 2012 年 10 月其信息储量达到 10PB。这是多么恐怖的数据量,更不用说在这些年信息爆炸的时代,更多的数据被收集和上传。互联网档案馆的数据包括方方面面,有些值得永久存储而有些不值得。报纸、邮件、照片、合同,不同的数据对不同人的价值也不同,但如果能够让用户订制化的永久存储要求的数据,将会替代纸质作为新一代重要信息的留存媒介。

云存储一直以来都是区块链的落地方向之一。这是源于中心化云存依托于中心化节点和服务器,存在可能的隐私信息泄露、服务器物理损毁的、被黑客攻击和盈利模式不稳定导致运营公司破产等问题。相对于中心化的服务器,去中心化云存储将资源保留在本地和链上,解决了中心化节点和服务器可能存在的诸多问题。而对于用户来说,此前多次发生的数据泄漏事件令他们对中心化的服务器存储非常失望,更愿意自己保有自己的数据。所谓 Web3.0 主打的概念之一就是将信息隐私的所有还给用户,而去中心化存储是其中不能缺少的一部分。

主打去中心化存储的项目很多,其中最有名的是 IPFS,它是一种内容可寻址的对等超媒体分发协议,在 IPFS 网络中的节点将构成一个分布式文件系统。搭建在 IPFS 上的激励层有很多,其中最大的是 Filecoin,用户可以支付 Filecoin 在 IPFS 上进行付费存储。而节点是可以挖矿获取 FIL 报酬。Storj 和 IPFS 实现的方式比较类似,无需将文件复制到多个主机,而是使用擦除编码和点对点并行传递。Sia 则是解决了用户需要一直在线和去中心化验证的问题,并且加入了抵押物的激励模型。但目前这些项目都是按照空间和时间两个维度收费,不具有永久储存的概念。同时推广不足等原因,占领的市场规模不大,尚不足以与中心化存储相提并论。

模式(7.5 分)

项目主打收取一次费用永久储存的概念,希望解决假消息对现实世界的影响。每当个人电脑中的客户端付费上传文件请求存储,DApp 后面的节点会接受文件并且产生相应的读写交易(包括文件本身)。交易将和文件一起被发送至全网,其他节点可以将这部份信息放在自身的文件池中,自行下载文件,符合要求的节点用 POW 竞争出块。成功出块的节点将会把交易和文件的完整信息写在块中,然后把块内容的简略信息(哈希值)和参与过交易的账户列表做成简化版的区块(Blockshadow)发布到全网。接收到简化版区块的节点可以对区块进行验证。验证方式是比对区块内容的简略信息和最初被发送到全网的文件是否能够完全对应。

在网络中,节点要完成出块需要达成两个条件,一个是储存尽可能多的历史区块,另一个是回答 POW 的数学难题,前者是前提,也是量化回报的方式。所以在验证之后非出块节点继续保存区块文件的动力。由于假设原有节点为了经济激励会持续运营节点,并且网络中一直有新的节点加入,所以不断会有节点去保存原有的老区块,也就实现了区块的永久保存。在这个模式中,被存储文件不只是一次性的提供激励,而是持续的隐形激励新的节点入局。这就要求出块的激励是比较诱人的,必须超过节点入局的费用,可测算的边际利益大于边际成本,才会有新的节点入场。同时,如果整个网络愿意出块的节点数量停滞在一个水平线上,单个节点全节点文件会变的很大,也就是说永久存储的负担会很大,如果出块的收益无法覆盖成本,节点也不会继续运转。这个涉及到不同节点之间的博弈,但是根本问题在于对用户存储的收费。

按照目前 App 提供的数据,存储收费相对于其他存储手段高上很多,1TB 数据在 2000 美元左右。虽然随着技术的发展,专业的节点存储设备甚至个人设备的存储能力会越来越强,成本也会越来越低。并且随着网络内节点的越来越多,每个节点储存的空间会呈现正态分布的状态,届时存储费率会降低。但是按照目前的价格来看,使用这种永久存储的成本依然过高,商业价值不足。

技术(8 分)

项目有四个比较核心的技术,接下来将一一介绍:

Blockweave:项目采用了一种叫做 Blockweave 的全新的区块链数据结构,这种结构是由于共识机制和特定的出块模式造成的。在这个数据结构中,想要挖矿的节点不必像 BTC、ETH 节点一样储存全节点文件。只要节点储存了某一个历史区块,就有几率被选中出块,储存的越多,被选中的几率越高。换句话说,只有拥有随机区块的节点才能进行 POW 出块。这种模式减少了 POW 能源消耗,也减少了节点的无用功。

POA:项目的共识机制叫做 POA (proof of access),即利用随机数将随机制定新区块验证一个曾出现过的区块,相比于普通区块链使用链状结构传递的储存所有链上的信息,这种共识机制造成的更像是网状结构,对节点存储文件的负担也更小。同样的,只有知晓被选出的随机区块的节点才能运行 POW 出块。

BlockShadow:节点验证时无需验证整个存储文件。节点在出块时并不是将整个存储文件交给其他节点审阅,而是将存储内容放在区块内,只传输一段哈希值和账户列表。这段哈希值代表了这部分内容,其他节点通过验证这段哈希值和文件池内的是否能对应的上。这种方式加快了验证的效率,将一部分的工作转移到链下进行。同样的,调用时也只需要 BlockShadow 就能定位到存储的区块完成调用。

Wildfire:为了激励节点和解决节点存储大量无效信息的问题,项目方设计了一套名叫 ALLA 的声誉体系,节点之间可以互相打分,从而激励节点验证储存内容,保证内容的健康有效。这个打分的结果主要应用于调用存储文件时。在用户调用文件的请求通过节点发出之后,多个存储了文件的节点将会竞争回应这个请求,而完成出块的节点会根据声誉值选出声誉最好的节点提供文件。

项目整体的技术设计还是以降低节点的准入门槛和 POW 无用能耗为主。可以算是结合了 POW 和 POS。这种模式有利也有弊,主要问题除了前文所述的节点文件大小和激励的不匹配,还有文件的安全性问题。技术设计中节点上传文件是本身直接会发送给全网的所有节点,那么文件的内容自然也会被所有节点看到。一方面某些隐秘的文件不适合上传,比如说非公开的政府文件。另一方面也对用户数据的所有权有挑战。是否可以增加密码学的部分解决这个问题?可能团队可以往这个方向去思考。

项目目前已经在 Github 上完成部分开源,主链 143 个星标,27 次 fork。使用 Erlang 语言开发,更新较为频繁。另外有大约 400 个矿工在挖矿,技术社区内也有用户主动帮忙维护和升级网络。项目的主网和 App 都已经上线,需要在测试环境下下载。

生态(7 分)

该项目的社区规模较小,telegram 只有 7033 人,twitter 关注数也只有 4166 人。Medium 上月报更新到九月份,之后停止更新,但仍然保持对社区成员的介绍。根据九月的月报,Arweave 社区截止今年九月共提交了超过 4.7 万件存储条目,在过去 6 个月里,Arweave 的数据总量增长了 5 倍多。但是整体的存储条目和付费情况依然不佳。目前有 79 个 DApp 用 Arweave 做为存储层,可以视作是生态项目。但是这些项目提供的数据都不具有永久储存的价值(包括一些游戏),DApp 的开发质量也比较差,无法有效引流。目前整体看下来项目落地方面做得很一般。

项目是向后兼容 IPFS 的,也就是说可以作为 IPFS 激励层。对于有永久存储需求的用户来说,如果项目的价格合适,是有可能从 IPFS 过度过来。相信也发现了自身的价格相对于其他存储方式劣势较大。既然对价格敏感的 C 端用户走不通,是否可以尝试和 B 端合作,与图书馆、大学、政府等机构合作,将重要文件转移到永久存储的区块链网络上。在节点和用户足够多,存储价格有一定下浮的情况下,再进行 C 端引流。

团队(7 分)

不知是何原因,项目方在官网上撤下他们团队的介绍。根据 ICObench 上的数据,项目共有八个全职成员。

创始人 &CEO Sam Williams 拿到了肯特大学的 CS 博士学位,PHD 在读时就开始做这个项目,毕业后全职开展。目前除了该项目 CEO 的职位,2018 年初开始兼任 Techstars 孵化器的导师和 LAG 基金会的会员。从领英履历上可以推测 Arweave 在 2018 年底基本完成。

联合创始人 Willam Jones 也拿到了肯特大学 CS 博士学位,领英显示目前一边在做这个项目一边在从 2019 年 8 月开始在 Embecosm 接 AI 和机器学习的外包工作,不知是否已经从 Arweave 离职。

CCO India Raybould 2014 年从曼彻斯特大学心理学专业毕业,2017 年底项目创立时就成为 Arweave 的 UI/UX 设计师和首席协调官。此前在一个教会大学做学生心理学顾问。

其余的开发者包括 kent 大学的在校学生 2 位(均于 2018 年 8 月离职),5 年开发经验的工程师,自由职业者。团队技术上编码能力并不强,但是黏度较好。根据领英推测团队在 2018 年年底基本完成开发,并进入社区和基金会自治的阶段。

由于官网已经撤下了团队成员的介绍,所以无法准确判断成员的去留情况并且是否有新增的成员。

融资(8 分)

项目原名 Archain,于 2017 年中创立,代币总量为 6600 万枚。后续在 2019 年 10 月获得 a16z、USV 和 Multcoin Capital 的 500 万美元投资,尚不清楚此次投资是对于股权还是代币,同时项目披露了此前的投资人包括之前的投资者包括 1kx 的 Lasse Clausen,Christopher Heymann, Arrington XRP Capital 和 The Techstars global network。

总结(7.5 分)

从 2017 年年中到 2018 年年中,项目方花了一年的时间将产品开发出来,并且完成了公募轮的融资,相信这已经比绝大多数在白皮书阶段就融资项目有良心的多。但是上线一年,项目方依然没有获取足够的生态,这是项目需要反思的问题,也是很多技术出身的区块链项目的通病。部分成员也从 2019 年初离开项目或去兼职,是否可以认为对项目失去了信心呢?2019 年 11 月 A16Z 领投的投资无疑对项目是个很强的激励,希望在拿到融资和潜在的渠道之后,项目能更好的落地。

项目的设计理念和经济模型逻辑都是比较出色的,更多的是通过经济激励的手法而非技术手段实现了永久储存。但项目仍然存在几个问题,一个是节点的数量的增幅需要和储存文件的扩大相匹配,不然单个节点的区块文件过大,激励无法覆盖成本。第二是大部分的内容不值得花费较高成本实现永久储存。项目永久储存的价格需要将目标储存多年才能值回票价,而这类的信息在现实世界较少,平台现有的 DApp 数据也不需要永久储存。第三是用户人数较少,相对于 SIA 和 IPFS 等云存储项目,该项目的社区规模较小并且 B 端合作不足,虽然产品比较完善,但是使用人数较堪忧。总的来说,看好项目的技术和概念前景,但需要解决费用问题,节点量问题和用户量问题。