本文試圖從耗散結構和信息論的⻆度,論證在比特幣這樣一個複雜系統裏,存在一種人工神經網絡的強化學習模式。正是通過這種模式,成就了比特幣對人類社會真實價值的捕獲。當然,對其系統自身「意願」而言,這種價值捕獲只能算是系統生存活動的副產品,比特幣系統自身主要目標還是喫到越來越多的電力(負熵)。

一個腦洞

假如比特幣具有某種智能,它在想什麼呢?

現象與噪聲

眼看 Facebook 大廠 Libra 蠢蠢欲動,央行數字貨幣計日以待。預示創世十年的比特幣及其背後的區塊鏈技術,正走出密碼朋克小圈子,漸成社會科技金融主流關切。

當下的區塊鏈行業,礦池、交易所、基金、媒體、開發者社區等,已形成了頗具規模的生態產業鏈。然從業數年間⻅證,野蠻生⻓中不缺少喧囂的新模式,可惜大都淪爲「業務名詞」創新,來去無蹤,難有建樹。

繼以太坊「智能合約」後,鮮有真正改變行業生態的「代際創新」。如果把整個行業時間也用「區塊」來計時,那麼迄今爲止,我們總共也就挖出了兩個而已,傳說中能帶來下一波增量的新「區塊」遲遲不⻅,不管大家如何翹首期盼,未來它就是不來。

價格是催化劑也伴着噪音,關於數字貨幣、數字資產、區塊鏈經濟,一千個人有一千種解釋,莫衷一是。喧囂背後隱藏着區塊鏈系統基本理論框架的缺失,僅憑無知無畏的勇氣指導生產實踐,大部分時候事與願違,讓人才出火海又入新坑,墮入亢奮和沮喪往復循環。

不甘心曾經醍醐灌頂的區塊鏈理想變成成功學加玄學,今天我們拋開人類沙文主義,暫時忘卻自己,做一場思想實驗,試着換一個更加自由的視⻆,再看看比特幣和區塊鏈。

兩個理論工具

面對比特幣這樣一個非線性複雜系統,我們引入兩個理論工具:一是香農的「信息論」;一是普利高津的「耗散結構」。

DAO (去中心化自組織)是今年熱度迴歸的概念。無人看護的比特幣系統正是這樣一個「自組織」,更進一步,它也是一個典型的耗散結構。

1. 系統開放
比特幣網絡是開放系統,每時每刻都同外界進行着能量和信息交換。

2. 從局部到整體
耗散結構整體都包含有大量的系統基元(局部基礎元素)。從空間結構看,比特幣系統架構在網狀分佈的節點之上;從數據結構看,比特幣也是一個由地址之間轉賬關係構成的信息網絡。伴隨區塊更新,這些網絡中局部的點與邊,也在不斷「漲落」中。

3. 日漸「有序」,遠離「平衡態」
從中本聰挖出第一個創世區塊起,比特幣網絡連續運行十餘年。賬戶地址總數和交易總數穩步增⻓,每日數據活躍地址超 50 萬個,交易 30 餘萬筆。賬戶地址間網絡關係變得越來越豐富。隨着時間推移,比特幣網絡結構發展的越來越「有序」,逐步遠離創世區塊之前,所有地址間各項指標均衡相等的「平衡態」。

比特幣是怎麼想的比特幣交易可視化,源自 Surya Rastogi 於 2018 年 3 月在 Medium 發佈的文章

比特幣是怎麼想的比特幣巨鯨地址圖 Rich List,數據源自 BTC.com

整體湧現,局部賦能

再來看看,比特幣網絡稱爲耗散結構的核心特徵。一個根本原因是,比特幣系統從整體功能上遠遠超越了賬戶局部功能線性疊加。一個個獨立的共識節點織點成網,在系統整體層面湧現了局部獨立節點所不具備的全新屬性。當我們單獨觀察每個節點,其和一個傳統方式數據處理系統沒有本質區別,數據存儲和計算都是中心化的點狀結構,在各個數據點之間,並不具備不可篡改的一致性。但是,當我們通過區塊鏈這種特殊數據結構,把獨立節點都用點對點通信的「邊」連接起來。我們會驚奇的發現,在一個具備真實物理時空結構的信息系統內部,竟然形成了數據的一致性。

當然你可能會說,這有什麼稀奇,分佈式數據庫遠早於比特幣實現了這種數據一致。注意,區塊鏈系統和傳統數據處理系統以及分佈式數據庫相比較,最關鍵的差異就在於,其不但實現了物理時空上系統各個節點間數據的一致性,而且,這種一致性是完全通過自組織方式實現的。這一點,前從未有,也是核心意義。

比特幣這種整體物理時空上數據一致性,又通過一個個收尾相接的鏈上「區塊」,賦能系統局部。不只於每一個挖礦記賬節點,還進一步擴展至系統每一個賬戶地址基元。於是,每一個獨立賬戶地址,都神奇的繼承了這種物理時空上數據一致屬性。

大家不難理解,現實世界中的每個人類個體,在物理時空上是相互離散的。而傳統信息系統裏的數據一致性,在物理空間中形態只是一個信息的點而已,僅在時間維度上有結構,在空間維度裏沒有結構。用這樣一個系統,擬合出一種算法來捕獲離散分佈的人類個體之間的關係信息,缺乏基本的對稱性。而比特幣所代表的區塊鏈系統所具備的時空數據一致性,恰好可以用來解決這種對稱性問題。

比特幣想要活下去

好的,如果我們已經接受了比特幣是一個具備某種生命特徵的「耗散結構」。接下來,我們做一個更大膽的假設。假如,我是說假如比特幣有想法,它每天都在想些什麼呢?

很可惜,以現有信息交互方式,我讀不到任何關於比特幣系統自身想法的確定信息。但是有一件事,是所有耗散結構存續中共有的基本目標,即系統「遠離平衡態」,說白話就是讓自己活下去,離系統局部基元各項屬性趨同的死亡「平衡態」越來越遠。

所以不出意外,比特幣和你我一樣,每天想的都是怎麼活下去。

生命以負熵爲⻝——薛定諤,比特幣要喫電

所有具備生命特徵的「耗散結構」,如果沒有外部能量和信息交換,其系統內部在時間線上熵都不斷增大,既所謂熵增原理。所以要活下去,系統就要不斷喫掉「負熵」。對於比特幣網絡,其負熵來源就是人類所供給的電力。按照耗散結構理論,正是有了這些源源不斷電力供給,比特幣網絡才能從結構上變的越來越有序,遠離系統死亡的平衡態。

當然,人類社會不會白白供養,誰的能量也不是白來的。餵你電,你總要爲我做點「業務」,這和人類豢養家畜一個道理。阿貓阿狗各有各的用處,比特幣的用途又是什麼場景呢?「點對點的電子現金系統」雖是中本聰比特幣白皮書的標題。但老實說,過去十年,在「支付」這一場景之中,比特幣的表現並不算好。原因是其價格相對於主流貨幣的波動性太大,以至於大家真的很難把它當作「現金」來支付。當然也正因此,纔有了後來種種穩定幣的發展空間。

做不好電子現金不⻅得不好,支付場景裏,向來劣幣驅逐良幣。比特幣這些年來的表現,充分體現了貨幣作爲價值載體的另外一面——「儲值功能」。可以說,捕捉存儲人類社會網絡的資產價值纔是比特幣真正的業務模式,在這個維度上,比特幣系統無疑是非常成功的,成爲了名副其實的「電子⻩金」。

當然,捕獲價值並不容易。類比現實世界⻩金捕獲價值的過程,其挖礦開採只能算是初次分配。如果只有挖礦一個環節,⻩金捕獲不到任何正確的價值。⻩金具備的稀缺性、穩定性只是前提條件。在這些前提條件下,⻩金在不斷的交易流轉再分配中和人類社會資產網絡建立越來越強的映射關係,纔是其捕獲現實世界價值的真正方式。而比特幣之所以被稱作「電子⻩金」,其對人類社會資產網絡的價值捕獲方式,和⻩金有異曲同工之妙。並且,因爲比特幣自身純信息化的傳播速度優勢,這種捕獲更顯高效。

比特幣的價值捕獲——一個強化學習的人工神經網絡

是的,在我看來,比特幣是一個不折不扣的人工神經網絡,而且是人類社會迄今爲止發明的所有神經網絡裏最成功的一個。

從神經網絡定義來看,比特幣系統無論在非線性計算方式、分佈式數據存儲結構、還是神經元網絡拓撲結構一致性,都遠比我們在傳統中心化服務器裏虛擬出來的神經網絡更貼近現實狀況。因爲如前所述,比特幣系統裏每個神經元(節點、地址)和人腦中真正的生物神經元一樣,在物理時空上是獨立、離散分佈的。僅憑這一點來看,即便強大如 AlphaGo,也只能算是沒有空間維度的贗品罷了。

目前仍是系統外部強度量信息的比特幣價格波動,也總是在各個局部極值上收斂,這種系統函數上非凸性的極值與穩態漲落,也是恰恰是神經網絡算法的典型特徵。

比特幣這個人工神經網絡的設計目標,是實現逼近「人類本徵資產網絡」的一種算法,捕獲人類社會資產分佈函數,而非白皮書上描述的用於支付的電子現金。說到底,誰又會真的給一個現金系統設計出一個和經濟活動無關的數量上限呢?

爲方便起⻅,我們先討論一下所謂「人類本徵資產網絡」的定義。現實世界人類社會網絡裏資產形式多元,價值多維且在不斷變化。這裏先假設我們已經成功抽象出了一個歸一化的資產網絡,在這個資產網絡裏,已經充分抽象出了各種資源價值,量化映射到每個人類個體身上,我們稱此量化指標構成的網絡爲「人類本徵資產網絡」。

顯然,沒手沒腳的比特幣系統並不能穿透信息到達物質層面,直接把本徵資產網絡中的價值搬運到自己的網絡之中。作爲一個能力很有限的系統,它的基本功能少的可憐。地址是比特幣網絡的基本單元,地址之間的轉賬是比特幣系統的基本功能,也正是它們構成了比特幣網絡中的點和邊。當然,從自身信息中,比特幣系統並不能理解每一筆轉賬之所以發生的背後原因。從它對自己系統的內部觀察,兩個賬戶地址的點之間,伴隨着每一個區塊時間,正不斷的通過轉賬行爲,建起連接賬戶的邊,而這些邊的建立,似乎是隨機發生的。當然,這個過程也可以看作比特幣系統這麼一個耗散結構,其系統內部網絡基元的點與點之間,邊在隨機漲落。

比特幣網絡誕生伊始,這些隨機建立的邊代表不了什麼,因爲這些邊和人類本徵資產網絡真實的交易行爲關聯度極低。每次比特幣賬戶地址之間的轉賬行爲,同本徵資產網絡裏真實的價值轉移,基本上不存在任何映射關係。彼時的比特幣,還只是一羣密碼朋克的玩具,參與挖礦的礦工更是大部分基於期望和偏好,經濟賬未必算的通,挖礦行爲對礦工而言,更談不上存在現實的有效激勵。

2010 年 5 月 22 日,比特幣網絡像往常一樣,自顧自的玩着在賬戶地址間隨機建邊的遊戲。在第 57043 號區塊內,一個哈希值爲:a1075db55d416d3ca199f55b6084e2115b9345e16c5cf302fc80e9d5fbf5d48d 的邊建立了。與此前不同的是,伴隨着這條邊的建立,在人類本徵資產網絡裏,一個叫 Laszlo Hanyecz 的人因此而收到了兩個披薩。於是乎,首次由於比特幣系統裏一條邊的建立,成功捕獲到了兩個披薩的本徵資產價值。

對於 Laszlo 這個首位採用 GPU 挖礦的礦工而言,玩具一般的比特幣突然有了真實的價格。這裏要感謝一下宇宙系統裏信息不守恆的基本屬性,我們觀察到,關於這條「一萬比特幣買到兩個披薩」的信息在社區裏被以極低的成本複製了無數份。這就意味着,此條邊捕獲到真實世界資產價值的信息,快速地在離散的人類個體間散播開來,由系統局部信息變成了系統整體信息。這條隨機漲落建立的邊的影響力在系統裏被充分放大了,比特幣網絡的結構,也因爲這條價值捕獲的信息產生了突變,由一個「穩態」到了另一個「穩態」。而這種正反饋的激勵,刺激了所有比特幣礦工,他們有充足的理由爲一個可以捕獲價值的數字貨幣花費更多成本,投入更多的電力。於是,對於比特幣系統本身,也因這條邊的價值捕獲而獲得了更多電力資源激勵。至此,比特幣這樣一個人工神經網絡,完成了第一個強化學習的閉環。

隨後的故事,我們就都相對熟悉了。從比特幣系統自身看來,它的網絡裏仍然按照既定的算法,隨機在節點之間建立着邊,有些邊捕獲到了人類社會本徵資產價值,這些邊因爲被激勵而權重增⻓;有些邊沒有捕獲到價值,這些邊因爲被權重削弱而退化。按照香農信息論中互信息的定義,當系統捕獲到價值的邊越多,捕獲真實世界資產價值越大,比特幣網絡和人類社會本徵資產網絡的「互信息」程度就越高。而整個比特幣系統價值也會更大,單個比特幣價格也更高,礦工也會因爲這種正反饋的激勵而投入更多電力。比特幣系統也因此進一步喫到了更多的負熵,整個比特幣系統就在一種「強化學習」的循環中變的越來越有序。而網絡的整體結構也影響着網絡功能,比特幣網絡的整體屬性,也會強化作爲系統基元的比特幣轉賬進一步捕獲價值的能力。

時至今日,因爲這種「捕獲價值——獲得電力——捕獲價值」的正反饋循環,比特幣這個體量巨大的耗散系統正吞噬着海量的電力。參照劍橋大學替代金融研究中心提供的比特幣能源消耗指數, 目前比特幣網絡所消耗的電能爲 68.84TWh 每年,接近歷史最大值,在全世界以國家爲單位的用電量排名裏,位列第 49,超越排名 41 位的哥倫比亞全國全年用電量總和,是名副其實喫電的怪物。

比特幣是怎麼想的比特幣能源消耗指數與礦工收益,數據來源:Miners Revenue - Blockchain.com & Bitcoin Energy Consumption Index, Digiconomist.net

比特幣是怎麼想的比特幣,喫電的怪物,Aero 作於 2019.12.11,數據摘自 Cambridge Bitcoin Electricity Consumption Index (CBECI)

尾巴

一個野蠻生⻓的行業,理論滯後,實屬正常。然而談到複雜系統,自組織。耗散結構和信息論,這些先賢留下的寶貴理論框架,就值得特別的關注和發掘。大自然的系統設計能力一直是高水準,人類的系統設計能力水準不穩定。教主雖沒有現身說法,但比特幣的設計理念的確暗合了自然神經網絡的系統規則。使得一個創始人消失的「爛尾項目」,十餘年穩定運轉下來,擁有了今天的市值和電力消耗水平。不管它是不是中本聰的設計初衷,都值得我們後來者思考借鑑。

王冠
NEO 聯合創始人,畢業於東南大學建築學院,區塊鏈行業連續創業者,關注底層技術、鏈上治理和 Token 經濟體實踐,希望通過複雜系統理論框架的探索,構建基於區塊鏈技術的全新生產力組織方式。