數據是現代商業與個人的核心價值與重要資產。數據正在重新塑造人類生活的方方面面,IDC Research 統計 2019 年大數據和分析市場的銷售收入約爲 1870 億美元。跨機構、跨行業的數據融合、聯合分析和建模的需求日趨增加。但由於數據本身可複製,易傳播,一經分享無法追蹤,數據資產的確權困難,商業化被嚴重製約。

數據隱私監管日益加強,中央出臺了《關於構建更加完善的要素市場化配置體制機制的意見》,首次將數據納入生產要素。2019 年下半年,監管部門則密集出臺了《數據安全管理辦法》、《App 違法違規收集使用個人信息行爲認定方法》、《個人金融信息(數據)保護試行辦法》等多項徵求意見稿及草案。同時,監管部門徹查了大量買賣個人數據黑產的“大數據公司”,我國的數據行業勢必將走向規範。
針對數據共享面臨的問題,隱私計算技術可爲業界提供新思路,賦能數據確權並實現數據”可用但不可見”。參與數據分析的各方,互相看不到數據,但是可以共同做分析甚至訓練模型,將最終結果發送給數據付費方,即可從技術上杜絕數據泄漏的風險。目前安全多方計算、聯邦學習等隱私計算技術逐步走向成熟,在涉及用戶隱私數據的金融、醫療、政務等領域中,讓機構間的數據合作成爲可能。而隱私計算與區塊鏈技術的結合,既能保證輸入數據可信,亦可隱藏運算過程,可謂魚和熊掌可以兼得。
本文根據隱私計算初創公司 ARPA 聯合創始人兼 CEO 徐茂桐 5 月 22 日在京東數科智管有方平臺直播分享整理:
ARPA x 京東數科:隱私計算如何賦能未來金融數據共享
曹弋-京東數科:歡迎徐總來到京東數科的智管有方平臺,和大家做關於隱私計算賦能金融數據共享的分享。《大咖視界》是京東的一檔直播分享欄目,旨在邀請金融領域的大咖,以及京東數科生態合作伙伴,與我們的金融機構客戶碰撞新的 ideas。
京東數字科技創立於京東集團內部,前身爲京東金融。截至 2018 年底,京東數字科技已累計服務涵蓋 4 億個人用戶、800 萬線上線下小微企業、700 多家各類金融機構、17000 家創業創新公司、數十座城市的政府和公共服務機構。資管事業部於 2015 年底起步於結構金融業務,其中資管科技板塊定位爲以客戶爲中心,打造覆蓋多市場、多產品、多客戶,提供融金融與科技服務於一體的領先資管科技平臺。
徐茂桐-ARPA:謝謝各位。大家好,我叫徐茂桐,ARPA 聯合創始人 & CEO,紐約大學斯特恩商學院信息技術與金融雙學位,曾於復星集團旗下的早期基金復星銳正資本覆蓋金融科技、AI 大數據等行業,並獨立負責區塊鏈領域的研究與早期投資,此前曾任職於紐約 Sackler Family Office, Vertical Research Partners 等投資機構。
ARPA 致力於用安全多方計算和區塊鏈解決數據安全共享問題,成爲分佈式商業中的數據交換基礎設施。ARPA 目前的核心產品爲基於安全多方計算的隱私計算平臺 (Secure Computation Platform),賦能企業間高價值數據的安全查詢、聯合分析與模型訓練,可使用於可使用於金融聯合風控、黑名單查詢、跨部門數據協同等衆多場景,讓數據可用但不可見。團隊成員曾就職於谷歌、 亞馬遜、華爲、復星、清華國家密碼重點實驗室等領先機構。ARPA 與中國信息通信研究院共同制定安全多方計算標準,並參與制定 IEEE 國際標準。落地方面,與多個 500 強企業有概念驗證和早期產品。ARPA 被中國企業報和中國軟件行業協會評爲 2019 年度中國十大創新區塊鏈企業之一。
曹弋-京東數科:您能否談談對數據行業的看法,以及隱私計算未來對數據行業可能產生的改變?**
徐茂桐-ARPA:衆所周知數據是信息時代的重要資產,我個人認爲數據行業有三個發展階段。目前主要集中對企業內部數據的收集、整理、分析。比如 ERP、SaaS、數據中臺等系統以及 IoT 設備數據的採集,將企業數據做彙總和分析。這是過去 20 年的大機會,未來將持續很長一段時間。
ARPA x 京東數科:隱私計算如何賦能未來金融數據共享
下一個大趨勢是企業間數據流轉。
數據的融合與交叉使⽤用可提⾼其價值,但是歸集數據進⾏分析的方式面臨數據泄漏的風險。同時針對個⼈隱私數據的使⽤,歐盟 GDPR、美國 CCPA 的以及我國的監管愈加嚴厲。從去年開始,大數據行業逐漸規範,買賣個人數據的行爲有所減少。隱私計算可以合規的、在保護個⼈人和公司隱私的同時提取數據價值,是未來⼗年的不可逆的趨勢。全球領先的科技研究機構 Gartner 認爲隱私計算處於爆發初期,主要的驅動力是隱私監管,目前的滲透率底,潛在市場機會大。
ARPA x 京東數科:隱私計算如何賦能未來金融數據共享
徐茂桐-ARPA:下面我來簡單介紹下安全多方計算。
安全多方計算 , 英文叫 Secure Multi-Party Computation, 簡稱 MPC。別名有安全計算(Secure Computation)和隱私保護計算(Privacy-Preserving Computation)。安全多方計算是當今密碼學的一個重要分支,是繼成熟解決數據加密存儲、傳輸之後的重要嘗試,在密文數據上直接構建運算。
具體而言,安全多方計算由 n 個互相不信任的參與方進行,聯合對一個協商確定的函數進行計算,能夠保證參與方的隱私輸入數據 x1,x2,···,xn 無法被其他參與方獲得。
姚期智院士 (Andrew C.Yao) 於 1982 年發表的文章“ Protocols for Secure Computation”首次提出姚氏百萬富翁問題和安全多方計算的概念。這個有趣的問題是,兩個百萬富翁希望知道誰更富有,但是不希望對方或第三方知道自己的財富值。
此後 Goldreich,Micali 和 Widgerson 等密碼學家將這個問題一般化成爲現在的安全多方計算問題。此後該領域內學術研究和商業應用蓬勃發展,如今安全多方計算協議是多種密碼協議的組合,如同態加密、零知識證明、祕密分享等。近 10 年來,密碼學界對安全多方計算的探索有了長足的發展,我們在實踐中發現一些特定協議的計算效率已經達到商用程度。與區塊鏈類似,安全多方計算同樣存在“不可能三角”,需要在安全性,通用性,計算效率這三點之間權衡。工業界,包括 ARPA,會根據不同場景優化協議使之滿足商業需求。
ARPA x 京東數科:隱私計算如何賦能未來金融數據共享
曹弋-京東數科:安全多方計算的技術成熟度如何,是否已經有場景可以大規模推廣?
徐茂桐-ARPA:隱私計算正在逐步被應用於金融和保險風控、OTC 交易、資產管理、互聯網營銷等領域。同時作爲一項前沿技術,隱私計算的從業者在積極推動技術的標準化工作。2019 年 6 月,工信部直屬單位中國信息通信研究院正式發佈《基於安全多方計算的數據流通產品技術要求與測試方法》行業標準,ARPA、阿里巴巴、螞蟻金服、百度等企業參與制定。國際上,IEEE 安全多方計算國際標準的制定和 MPC Alliance 企業聯盟的建立也預示着隱私計算從學術界向工業界的拓展。我接下來分享幾個值得探索的隱私計算應用場景。
金融、保險黑名單安全查詢**
黑名單主要用於記錄個人或企業客戶的不良行爲。每個機構都會維護多種業務的黑名單,從小型商業公司到跨國機構,從金融交易到信用記錄。機構之間的黑名單共享和查詢有助於幫助機構規避風險,如多頭借貸、多頭騙保等,然而對於黑名單的明文共享既危害用戶隱私也泄露商業機密。利用隱私計算進行的黑名單查詢可以在保護隱私的情況下降低機構風險。這類計算需要對比兩組列表並找出其中重合的部分,這個過程應能保證參與方無法獲得除結果外的信息,並可以規避被查詢方獲得查詢條件。
營銷轉化率計算
轉化率計算這類數據共享問題即“隱私交集問題”。兩家公司分別持有自己業務範圍內活躍用戶數據集,一方擁有與第一個活動相關的用戶列表,例如在互聯網上查看廣告的用戶,另一方擁有在第二個活動中進行過交易的用戶列表,例如購買過廣告商品的用戶,以及與每個用戶關聯的數值(比如該用戶的支出)。其中一方希望瞭解他們共有的用戶數量以及相關數值的總和,而並不希望分享更多的數據。例如,廣告主希望知道“三十歲一下的男性消費總和是多少”,可以通過隱私計算在不共享數據和查詢條件的情況下獲得交集,計算轉化率等指標。
多維度風控模型
目前信貸風控需要通過多個數據源採集數據,進行決策樹、邏輯迴歸、隨機森林等運算。從 2019 年下半年開始,國家對非法採集販賣個人隱私數據的大數據公司進行了整頓,原始數據愈加難以獲得。隱私計算可以合規的鏈接同業和異業公司,組成數據聯盟,在各方輸入數據不泄露前提下進行分佈式模型推斷或者訓練,有效降低多頭信貸、欺詐等風險。同時風控模型的參數在計算中亦不會暴露,保護了模型提供方的知識產權。
曹弋-京東數科:京東數科於 2019 年 7 月正式向市場推出資管科技品牌 JT2 智管有方 2.0。智管有方 2.0 的架構就包括共識與加密。此前 ARPA 與京東數科這邊也有過聯合 PoC 的嘗試,您可以講一下具體案例麼?
徐茂桐-ARPA:京東數科的資管科技平臺可以爲金融機構客戶提供多種類型的金融模型,用於定價、風控等領域。其中較爲常見的是 Value at Risk 模型(VaR),金融機構可以利用 VaR 模型測算股票、債券的整體持倉風險。金融機構希望對持倉數據保密,而金融科技公司的模型參數亦需要保密。ARPA 的隱私計算解決方案可以爲雙方搭建安全 API,部署在雙方的服務器上。金融機構的持倉數據和科技公司的模型參數都以密文形式輸入,進行安全多方計算,最終輸出的 VaR 值給到金融機構。此外,我們瞭解到金融風控領域,金融機構在查詢外部黑名單時,往往不希望暴露“自己查了誰”這個信息,因爲這樣會暴露客戶信息。隱私計算同樣可應用於安全查詢的場景。
ARPA x 京東數科:隱私計算如何賦能未來金融數據共享
曹弋-京東數科:目前安全多方計算支持怎樣規模的數據計算?
徐茂桐-ARPA:當今使用的安全多方計算技術按底層技術分爲兩個分支,基於混淆電路(Garbled Circuit)的與基於祕密分享(Secret Sharing)。混淆電路與不經意傳輸(Oblivious Transfer)爲姚期智院士提出的安全計算技術路徑。簡單來講,基於混淆電路的協議更適用於兩方邏輯運算,通訊輪數固定,但是拓展性稍差。另一類基於祕密分享的安全多方計算中,數據輸入和計算中間值都會以“密文分片”的方式存在。祕密分享技術可以把隱私數據切割爲 2 份或更多份後,將隨機分片分發給計算參與方,這個過程保護了數據隱私又允許多方聯合對數據進行計算。之後,就可以利用分片間存在的同態計算性質來實現在分片上計算並重建得到隱私數據計算結果。基於祕密分享的安全多方計算目前主要由歐洲密碼學界主導,如 Smart, Damgard 等密碼學家,其拓展性較強,理論上支持無限多方參與計算,計算效率高,但通訊負載較大。目前 ARPA 最多做過 100 方的安全多方計算壓力測試。
曹弋-京東數科:您的方案中提到“所有參與⽅方發出的均爲密⽂文數據,整個運算過程不不泄露露任何原始數據”,數據模型構建在哪方服務器上?
徐茂桐-ARPA:數據模型會在數據和模型提供方的雙方或者多方服務器上,通過安全 API 進行安全計算,運算過程的數據均爲密文,也不會有第三方參與,不存在數據泄漏的可能性。
曹弋-京東數科:安全多方計算需要各方有哪些硬件支持?部署是否複雜**
徐茂桐-ARPA:現階段 MPC 功能以軟件解決方案爲主,以具體應用爲導向,提供定製化的解決方案。將高頻需求打包成 SDK 或安全計算平臺的 API。部署相對簡單,可以利用企業現有的服務器或雲計算資源,加裝 ARPA MPC 節點。ARPA 的安全多方計算解決方案包括 6 個專用解決方案(黑名單查詢,營銷轉化率計算,線性迴歸,風險價值模型,手寫數字識別,門限簽名)和 1 個通用 MPC 計算平臺。
我們採用的 MPC 協議池包括多種密碼學算法,因應用場景不同,按照計算任務構造 MPC 協議,已應用過的密碼算法包括:1)用於構造隱私求交集的加法同態,不經意傳輸;2)用於構造通用 MPC 計算的部分同態加密,祕密分享,Beaver 電路隨機化,信息論安全的信息校驗算法;3)用於有限輪數通信的 MPC 計算的混淆電路;4)用於門限簽名算法的祕密分享轉換算法;5)用於防止惡意攻擊而作爲安全保證的零知識證明,Pederson 與 Hash 承諾函數;6)用於節點通信的傳輸層安全通信算法。 曹弋-京東數科:您對隱私計算 / 安全多方計算的前景是什麼看法呢?

徐茂桐-ARPA:如果說信息時代是大廈,建立在數據的地基上,那麼隱私計算即爲這座大廈的電梯。我認爲隱私計算目前在我國的仍處於萌芽階段,可以預見的是隨着國家對隱私數據監管的加強,企業於個人對自身數據價值重視程度的提高,隱私計算將在 2020-2030 年實現爆炸式增長,甚至有望從零發展到數據共享的技術基礎設施。目前隱私計算行業既有螞蟻金服、百度、微衆銀行等大企業,也有 ARPA、華控清交等具有技術實力的創業企業,以及中國信息通信研究院、央行等國家研究機構。未來發展如何,讓我們拭目以待!**

關於 ARPA

ARPA 致力於爲企業與個人提供基於加密運算和區塊鏈的隱私數據安全流轉解決方案。

ARPA 安全多方計算網絡可以作爲協議層爲公鏈實現隱私計算能力,並賦能開發人員在私密智能合約上構建高效、安全、能保護數據隱私的的商業應用。企業和個人數據可以在 ARPA 計算網絡上被安全分析或利用,而不必擔心將數據暴露給任何第三方。ARPA 多方計算技術支持安全數據市場,精準營銷,信用評分計算,甚至個人數據的安全變現。

ARPA 的核心團隊高度國際化,有來自清華大學的密碼學博士,來自谷歌,優步,亞馬遜,華爲和三菱的經驗豐富的系統工程師,東京大學的區塊鏈專家,以及來自 AIG,世界銀行,CircleUp 的數據科學家,還有來自復星和富達投資的金融、數據方面的專業人士。

有關 ARPA 的更多信息,或加入我們的團隊,請通過 about@arpachain.io 與我們聯繫,或添加客服小姐姐:

ARPA x 京東數科:隱私計算如何賦能未來金融數據共享

更多 ARPA 官方資訊平臺

ARPA x 京東數科:隱私計算如何賦能未來金融數據共享關注微博:@ARPA 阿帕奇官方

ARPA x 京東數科:隱私計算如何賦能未來金融數據共享Twitter:@arpaofficial

ARPA x 京東數科:隱私計算如何賦能未來金融數據共享
Telegram:https://t.me/arpa_community

往期內容回顧

關於 ARPA 團隊 5 月回購銷燬 1000 萬代幣的公告
隱私計算——讓數據成爲信息時代的生產要素
ARPA 項目進展雙週報 5.2—5.16
ARPA 成立兩週年 | 創始人的一封信
重磅!ARPA 登陸韓國最大合規交易所 Bithumb

來源鏈接:mp.weixin.qq.com