萬向區塊鏈董事長肖風談區塊鏈和人工智能在數據要素市場中的作用。

原文標題:《世界人工智能大會 | 萬向區塊鏈肖風:數據要素市場與分佈式 AI 平臺》
演講:肖風,萬向區塊鏈董事長兼 CEO

2020 年 7 月 10 日,世界人工智能大會首個區塊鏈主題論壇圍繞「區塊鏈與 AI 的融合發展」、「區塊鏈與 AI 如何改變金融」、「國際區塊鏈的發展路徑」、「區塊鏈如何改變我們的生活」4 大議題展開了討論,意在探討區塊鏈技術與人工智能技術融合創新的可能性及其能夠帶來的價值。

萬向區塊鏈董事長兼 CEO 肖風博士受邀出席論壇,並發表了題爲《數據要素市場與分佈式 AI 平臺》的演講。在演講中,他分析了人類社會當前面臨的技術性遷徙,以及區塊鏈和人工智能在數據要素市場中的作用。

全文內容整理如下:

世界人工智能大會 | 萬向區塊鏈肖風:數據要素市場與分佈式 AI 平臺

非常高興有機會參加世界人工智能大會的區塊鏈論壇,這是一場跨界論壇。所以我今天的話題,也試圖從「跨界」的角度來談談我個人的一些思考。

海量數據是所有人工智能算法高效運行的前提。中小企業、中小科研機構可能沒有能力蒐集到海量數據。前段時間國家提出要建立「數據要素市場」,我想,其本意就是希望能夠通過建立數據要素市場,使數據流動起來,讓中小企業能夠擁有、交易符合需求的數據,從而使自己擁有人工智能的智能化能力。

這場世紀疫情突然把我們拋到了陌生的境地——一個數字化的世界裏。突然所有東西一夜之間線上化了。如果沒有線上化,你會感覺到非常不方便,甚至工作生活都無法正常進行。

基於我的個人觀察,我總結出了「數字化遷徙」的三個步驟:線上化—數字化—智能化。

線上化就是用 ICT 技術把工業的研發、生產、銷售、產品全流程及個人生活過程都搬到互聯網上。完成線上化之後,我們纔可能通過互聯網、物聯網低成本地收集到海量的數據,而這些數據是人工智能算法必要的生產要素。數字化即通過物聯網、互聯網收集、存儲、分析數據。在足夠數字化之後,我們纔可能走向智能化,即有效運作人工智能算法。

完成這三個步驟之後,我們才能開始談人工智能的應用。

我們都知道人工智能已經由高潮到低潮,起起落落三個來回了,爲什麼到今天才這麼普及、這麼深度地影響到所有人的生活、所有制造,甚至城市的治理?現在我們能夠通過互聯網和物聯網,低成本地擁有海量的數據是非常重要的一個前提。

數據要素的特點

數據作爲生產要素具有其自身的特點,這些特點與以往其他生產要素完全不同。我總結出了以下四個特點:

第一,數據確權。產權保護非常不容易,因爲數據虛幻飄渺,有高度的可流動性。按下計算機上的發送按鍵,數據可能就發送出去了。另外,數據又非常容易被複制,不像用複印機複印書,一本書可能有兩三百頁,複印成本很高。而數據的複製是零成本的,這對數據作爲生產要素是非常不利的。

第二,數據的所有權不可分離。舉個例子,我的基因數據不可能因爲被你買斷了就不再屬於我。由此可見,數據所有權和主體是無法分離的。不像股票,它所代表的所有權,從 A 轉向 B 時是一種買斷行爲,即當買入者從賣出者手中購入股票時,就擁有了該公司的一部分權利,賣出者則喪失了這部分權利。

第三,數據越分享價值越大。一條數據如果只有一個人用,它的價值非常小;如果有一萬個人用,才能真正發揮它的價值。所以數據具有很廣泛的社會性,我們需要讓它在更廣闊的範圍裏得到分享。

第四,數據的使用邊際成本爲零。數據一旦產生之後,無論是一個人用、一萬個人用還是一億個人用,它的邊際成本都是零。

數據要素市場的特點

正因爲數據要素的以上特點,我們要建立的數據要素市場,和我們熟悉的股票市場、債券市場、土地市場又有很大的不同。

第一,數據要素市場交易的是數據的使用權,不是所有權。剛剛講過數據所有權不能與主體分離,不能被買斷。

第二,所有數據交易的需求,都是跟特定用途和場景有關係的。任何標準化的交易和購買數據都不會是爲了升值,而是爲了滿足需求。

第三,數據交易是點對點的交易組織形式,有特定的交易對象。一方持有特定數據,另一方則有特定的需求,於是雙方點對點地完成這一筆交易。實際操作中,很難用集中的大數據交易所方式來組織所有的數據交易。

第四,數據交易是需要經過多方許可、多次許可的。一個數據的使用權可以賣給一萬個用戶,一個科學家可能要向一萬個人徵集數據,才能具有某種統計學上的意義或者得出普遍適用的結論。所以數據交易是一個需要多方許可、多次許可的市場。

第五,數據要素市場是非標準化的,不能像股票、債券那樣按照固定標準進行交易。

區塊鏈對於數據要素市場的價值

我一直認爲,大數據交易所這一組織形式並不適合數據要素市場,點對點的分散 OTC 市場(注:Over the Counter 場外交易市場)更合適數據要素的交易。要建立這樣的數據要素市場,我個人認爲離不開區塊鏈和隱私計算等技術。

1、數據可信:作爲點對點的數據要素市場,如何確保數據的可信度?這需要使用區塊鏈分佈式賬本的特點,大家共同記賬、不可刪除、不可篡改,只有在區塊鏈技術的加持之下,數據的可信度才能得到保證。

2、數據確權:如果數據產權得不到很好的確認,又如何能用於交易?區塊鏈可以以很低的成本對數據進行確權,主要依靠區塊鏈可存證、可追溯、可溯源、可審計等特點。這些分佈式賬本的標誌性特點,可以很好地幫助我們進行數據確權。

3、數據保護:區塊鏈用到的很多加密算法,比如哈希函數、非對稱加密、零知識證明等密碼學算法,給分散式數據要素市場提供了非常好的數據保護。如果數據不能得到保護,就一定會被盜用。

4、數據交換:數據得到保護之後還需要進行交換,如果不交換,就無法發揮出數據的價值。交換加密後的數據也需要用到很多密碼學算法,如可驗證計算、同態加密、安全多方計算等,這些密碼學算法能夠幫助數據在加密之後參與協同計算,從而得出我們需要的某些結論。

5、降本增效:數據交換過程中,點對點的分佈式數據市場如何幫助大家低成本、方便、快捷地完成這場價值交換?區塊鏈上的智能合約顯然是最合適的方法、工具。

6、價值分配:我們試想一下,一個科學家向一萬個數據擁有者徵集到了足夠多的樣本數據,計算出來一個他所需要的目標函數。此時他需要向一萬個陌生人支付數據的對價,最方便的方法就是使用可編程的數字貨幣,讓大家都完全相信它一定會得到對價。這種清算結算方式同時也是最省錢、最高效的。

在這六個方面,區塊鏈和隱私計算都可以非常好地適配點對點數據要素市場。

我們可以看到,區塊鏈技術和隱私計算技術會給人工智能插上「飛翔的翅膀」,使得數據隱私得到保護、數據資產得到確權、數據共享得到激勵、數據計算得以開放、數據治理得以有序進行。人工智能數據要素市場離不開區塊鏈和隱私計算技術。

綜上所述,鑑於數據的所有權非常分散,數據的使用權往往可以被多方多次地許可、交易,數據交易的市場是點對點的分佈式市場。基於區塊鏈和隱私計算技術基礎建立分佈式 AI 平臺將大有可爲。

分佈式 AI 平臺除了對應着前面所討論到的數據要素市場特點之外,更重要的是能賦能中小企業。到目前爲止,真正能將 AI 使用得非常好非常有效的是互聯網巨頭們。這是因爲他們有很好的互聯網平臺可以蒐集到海量的數據,同時他們也有很強大的財力利用數據優化人工智能算法。但是大量沒有雄厚財力獲取海量數據的中小企業也需要人工智能的賦能,因爲個人和中小企業也掌握了很多數據。

我們一方面需要用分佈式 AI 平臺更好地蒐集散落在市場和民間的數據,另一方面要賦能中小企業,讓他們獲得人工智能的加持。分佈式 AI 平臺是接下來人工智能界、區塊鏈界應該共同嚴肅討論的話題。

以上就是我今天的分享,謝謝大家!

世界人工智能大會 | 萬向區塊鏈肖風:數據要素市場與分佈式 AI 平臺


問答環節

主持人 :現在區塊鏈和 AI 這兩個技術都處於相對初期的發展階段,兩個技術要相互結合在一起,在這個階段是否有可能實現嗎?還是要等兩個技術都成熟以後纔會有更好的互動?

肖風:第一,人工智能技術和區塊鏈技術是不是處於發展初期,這點值得商榷。從上世紀 60 年代開始,人工智能已經經歷過三波高低潮的交替,我認爲它已經處於成熟期。

第二,我們必須在技術處於初期的時候加入到「戰場」中。1999 年、2000 年的時候互聯網也處於發展初期,因爲 TCP/IP 模型在 90 年代中期(1993 年、1994 年)才初步定型。在今天看來,所有偉大的互聯網公司幾乎都誕生在那個時候,所以千萬不能等。如果等到技術成熟了再入場,那麼基本上就沒戲了,這個市場不屬於你。

第三,這兩項技術都在逐漸發展成熟。人工智能技術和區塊鏈技術的不斷融合是它們走向成熟的必要條件。它們在融合當中會變得更加成熟。如果永遠不融合,它們各自的發展成熟速度可能都會放慢,所以推動這兩項技術的融合是當務之急。

來源鏈接:mp.weixin.qq.com