10 月 19 日财联社消息,国务院副总理刘鹤在“2020 世界 VR 产业大会云峰会”上发表书面致辞并指出:加快完善新型基础设施,统筹推进三类新型基础设施建设。其中有两类新型基础设施与分布式存储相关,包括提及以人工智能、云计算、区块链等为代表的新技术基础设施;以及以数据中心、智能计算中心为代表的算力基础设施。Filecoin 长期致力于打造:利用闲置资源进行存储有效数据,进而塑造成一个可扩展更多应用的数据交流平台。

那么,市场上有多少分布式存储项目以及各有怎样的商业模式?

一、高歌猛进的分布式存储赛道,Filecoin 几何?

以横向看,主要有 Filecoin、Curve、HDFS、Ceph 和 GlusterFS 等,从区块链赛道纵向看分别有 Filecoin、Arweave、Crust、Burst、Bluzelle、Storj 和 Sia 等。横向对比,我们可以从时间轴上观察分布式存储项目的发展路径;纵向对比,可以观察区块链中分布式存储项目的探索进程。

横向对比:他山之石,可以攻玉

Filecoin 与 IPFS

IPFS 项目通过整合 BitTorrent、DHT、Git 和 SFS 技术,创建一种 Peer-to-Peer 超媒体协议,试图打造一个更加快速、安全、开放的下一代互联网,实现互联网中永久可用、数据可以永久保存的全球文件存储系统。

Filecoin 是运行在 IPFS 上的一个激励层,是一个基于区块链的分布式存储网络,它把云存储变为一个算法市场,FIL 承担起整个市场的交易媒介作用。Filecoin 协议拥有数据检索和数据存储,交易双方在市场里面提交自己的需求,达成交易。

原力研究 | Filecoin 存储革命与生态价值,剑指何方?(上)

项目对比,IPFS 原力区,2020-10-19

Filecoin 综合了较多优秀项目的技术优点,专门针对 IPFS 网络构建出 Web 3.0 框架,以更大的弹性适用多种场景。以下是 Filecoin 与其它项目的差异点 :

访问接口的差异,满足大文件的存储交互。综合以上,Ceph、GlusterFS 以及其它主流的服务器都安装类 Unix 的操作系统,文件存储支持 POSXI 的 IO 语义。Filecoin 数据存储借鉴了传统的 POSIX 语义,因为文件太大无法容纳单个数据块所以无法 IPFS 的要求,因此需要 IPFS Unixfs 使用可插拔的数据分片算法对传统 POSIX 语义的文件进行分片。传统 POSXI 语义的文件是顺序存储的字节,IPFS Unixfs 是基于分片的有向无环图。

现阶段冷存储为主,后续支持更多应用多集群、多节点的大中小文件文件存储。目前 Filecoin 刚处于发展早期,并未有很多成熟、完善的程序应用落地,较为成熟的服务主要为冷存储。目前 Filecoin 生态中已经存在一些关于热存储和大中小文件存储的产品计划以及其它新方向,相信未来落地场景更为包罗万象。

检索而生,限速高吞吐访问。Filecoin 目前与 Ceph 类似,能够达到海量数据搜索的专用文件系统,但算法各异。目前遇到的问题是,Filecoin 目前还不能达到数据高吞吐量的要求,导致大规模商业落地受限。

纵向对比:硝烟正起, 百家争鸣

截至 2020 年 10 月 19 日,根据 Filecoin、Arweave、Crust、Burst、Storj 和 Sia 六个币种统计,总市值 55.06 亿元。其中,Filecoin 占比 65.23%,占龙头地位;次之是 Sia、Arweave,分别占比 14.50%、12.19%。

原力研究 | Filecoin 存储革命与生态价值,剑指何方?(上)

项目对比,IPFS 原力区,2020-10-19

虽然 Filecoin 上线缓慢,但是因为其后发之劲十足,在短短几天之内,其市值超过存储板块总市值 50%,主要原因基于以下几点:

2.57 亿美金融资额奠定了庞大的市值。对于一家企业来说,初始融资很大程度上决定了上市的估值规模。同时,多年的技术积累更能辅助市值进一步抬升。

Filecoin 以 Web 3.0 为终,以落地应用为始。Arweave、Burst、Bluzelle 等项目,很多项目都是概念先行,代币释放流通,项目真实落地规划相对比较久远,迟迟难以落地。从 Filecoin 构建生态可以看到,太空竞赛 1&2 阶段,一直在鼓励存储规模、存储需求和应用落地,极力于打造真正可落地的应用程序。这苛刻的经济模型的背后,除了把矿工紧紧的绑在一起之外,还把未来落地应用绑在一起,如 Smartcity、Zangshell 和 Starry Sky in Yunnan 等项目。

严苛的证明 机制 要求塑造最优质的存储服务。Filecoin 证明机制过于严格,也是对矿工运维能力的考验。正因如此,很多项目伺机而上,分叉或者衍生出另外一个低门槛参与的存储项目。其实这一切的背后,主要是协议实验室对 Filecoin 网络秉持着高质量的存储服务意识以及久远的落地概念,否则就如 Sia 一样,早早落地,但是市场规模和需求久久难以进一步扩大,困于 2 PiB 的全网算力。

紧接着,Filecoin 未来如何从这些项目中探索新的落地应用?

二、庖丁解牛分布式存储的商业模式

1) Ceph: 不断产品化升级的云计算基础设施

社区触发创新,产品化是最终的归宿

Ceph 之父 Sage Weil 曾说:“Ceph 从社区到商业化是大势所趋,毕竟所有技术的最终归宿都是产品。”

Ceph 借助社区和产品走向产品化。通过社区发散思维,追求创新,随之通过 Ceph 产品趋向稳定,探索不同的领域和不同的行业,做出稳定、可复制适用的企业级产品。社区让 Ceph 越来越繁荣,生态圈在不断扩大,包括对接不同的生态硬件软件。过去的几年中,依托于 Ceph 落地的应用覆盖了包括金融、政府、游戏、运营商、媒体等在内的众多重点行业,Ceph 主要应用场景有云平台、传统企业 IT 架构虚拟化等。

云计算基础设施转型

其实在最开始,Ceph 的初衷是为一个机房里面的超级计算机提供 PB 级存储方案,最初赋能的是 HPC 领域的文件系统。

原力研究 | Filecoin 存储革命与生态价值,剑指何方?(上)

随着云计算时代的到来,Ceph 目标也逐步演成为云计算提供基础设施,从当时的一个超算中心扩展到很多超算中心,规模不断扩大。Ceph 是先有的文件存储,结合开源的云管理平台 Openstack,发力在块和对象;从而成为文件、块、对象都有的统一存储,目前 Ceph 系统是能够满足云计算需求的。

Ceph 的发展进程可回顾为:先是存储方案解决,到文件存储升级、规模扩大,到逐步升级为统一存储,进而满足云计算的要求。

2) HDFS: Hadoop 抢占开源市场,开拓数据处理软件

2005 年,Doug Cutting 和 Mike Cafarella 在 HDFS 基础之上添加 MapReduce 计算产生出 Google 分布式文件系统 Hadoop,其核心技术还是基于 HDFS。

互联网雏形检验商业模式。随着互联网 Web 2.0 刚刚崛起,大量用户与网站数据爆炸式增长。此刻,大量互联网公司具备数据与需求,缺乏一个高性价比的数据分析系统。这时,开源、免费的 Hadoop 工具抓住了大数据的蓝海市场,奠定了商业模式的可行性。

开源运动创造了商机。21 世纪初,开发者社区掀起了开源运动。此时,Hadoop 创造出了一个开源的、免费的、符合互联网风格的大数据处理软件响应源代码可与世界互联,迅速在互联网大数据处理领域触达了这部分市场群体。

原力研究 | Filecoin 存储革命与生态价值,剑指何方?(上)

Hadoop 助力生态,生态反哺营收。也正是因为开源运动,Hadoop 短期内迅速成立三家公司(Cloudera、HotonWorks、MapR)开拓 Hadoop 开源生态,促进了 Hadoop 整个生态用户的部署采用率。最终 Hadoop 依靠商业推进开源生态建设,来实现生态反哺商业——实现营收。

Web 2.0 时代早期,Hadoop 通过免费数据分析系统服务抓住了市场缺口,捕获了大量的客户人群。后期其在推动开源生态发展的过程中,也在提供相应的开始转化为营收。

那么,还有哪些分布式存储商业模式?以及 Filecoin 可以从中获取哪方面的借鉴?市场前景如何?我们下篇文章继续分享。