當前位置:
首頁 > 科技 > 數據共享與隱私矛盾:技術未滿,向現實妥協

數據共享與隱私矛盾:技術未滿,向現實妥協

圖片來源@視覺中國

文|鋅鏈接,作者|易柏伶,編輯|王巧

大數據經濟浪潮已撲面而來。

幾十年來,全球IT行業遵循著摩爾定律所預測的速度發展著,直到現在,這一定律依然發揮著效用。當5G、雲計算、物聯網等技術越來越成熟,海量數據的生產、採集、存儲和處理成為了現實,智能化時代來臨,數據潛力也得到了空前釋放。

據國際數據公司和希捷公司的報告顯示,2020年中國數據總量將會超過8萬億GB,佔全球數據總量達20%左右,中國將成為數據生產量最大、類型最豐富的國家。

數據量爆發,依託數據的產業經濟規模也會空前擴大。據前瞻產業研究院發布報告顯示,預測在2020年我國大數據產業市場規模將突破萬億,2023年將增長至15700億元,同比增長15.4%。

大數據產業上升為國家戰略,數據也已成為國家、企業、個人的核心資產,數據共享和流通成為了剛性需求。例如,人工智慧的發展就依託於龐大的數據規模和數據多樣性。

然而,數據隱私保護與數據流通和使用效率之間的矛盾卻日益凸顯。2018年,歐洲GDPR數據保護條例的頒發將Facebook、Google等互聯網巨頭推上了風口浪尖,數據隱私被竊取、安全泄漏等事件層出不窮。

Facebook布局加密貨幣,表明了利用互聯網平台中心化搜集用戶數據,實現平台化的精準營銷的商業模式不再可持續。

去年,騰訊進行第三次組織架構調整,馬化騰發朋友圈強調,鑒於騰訊各平台數據的用戶個人隱私性較強,「我們更強調的是數據保護而非打通數據和唯演算法論。」

以密碼學為核心的區塊鏈技術,似乎有望打破數據的流動壁壘,開啟數據經濟時代新的商業模式。

在保證隱私安全的基礎上實現數據共享,已經有越來越多的公司加入這條賽道,但技術發展的速度似乎很難適應日益增長的商業需求。

大廠湧入,賽道註定越來越擠

2019年的科技圈,「數據中台」是最火的概念之一。從去年年中到今年6月,「數據中台」的百度指數從120一路狂奔達到了500多。人們對於數據中台概念的理解普遍為實現大集團各子公司,或者大公司各子部門之間數據交換、資產化和業務化的工具。

公信寶創始人黃敏強卻認為,這一概念的內涵似乎可以拓展到企業與企業之間的數據交換與共享,甚至可以從B端邁向C端,實現企業到個人的數據利用和隱私保護。

據鋅鏈接了解,早在2017年,數據共享平台就已經超過了100家,但還未有去中心化的數據共享平台出現。

隨後,公信寶便上線了去中心化數據交易平台。

黃敏強對鋅鏈接表示,數據共享與隱私問題可以通過可信計算 區塊鏈技術的方案來解決。「當可信計算運行在區塊鏈上,就擁有了中立性強、合規性高、商務成本低的特點,從而使得商業中的通用型訴求得到解決」。

趣鏈科技於2018年末開始搭建數據共享平台BitXMesh,大概半年後,一期產品上線。據其負責人汪小益向鋅鏈接介紹,趣鏈把整個項目的核心技術稱為「聯邦計算」,主要分三步走。

首先是分散式計算,利用趣鏈搭建的BitXMesh平台將模型分發到各個數據中心,這些數據中心分屬不同的機構或企業,共同配合完成一定的計算任務。

其次是分散式的安全計算,藉助TEE(Trusted? Execution Environment)可行性執行環境,結合傳輸網路的安全,實現分散式的安全計算。

最後是聯邦學習,這是谷歌在近幾年提出的一類機器學習演算法。趣鏈將打造聯邦學習平台,支持用戶自定義相關學習模型,在保護用戶數據隱私的前提下充分發揮分散數據的價值,構建完善的AI模型。

與公信寶和趣鏈所採用的硬體 密碼學結合的可信計算方式不同,PlatON堅持採用純密碼學方式實現數據共享過程中的隱私安全。

PlatON首席投資官唐虹剛向鋅鏈接介紹,PlatON數據流通和共享平台方案將基於MPC為核心的隱私計算技術,不依賴第三方硬體,實現Trustless下的數據隱私保護和數據確權,且具有更高的靈活性和通用性。」

唐虹剛認為,數據共享和流通是一個非常有潛力的市場。未來,數據是繼水電煤網之後第五個基礎社會資源,預計市場規模將會超過萬億美元。

黃敏強和唐虹剛的預測並非虛言,除了以上項目還有Trias、ARPA、TEEX等。今年以來,除了這些原生態區塊鏈技術公司,互聯網巨頭也紛紛搶灘數據共享與隱私安全領域。

螞蟻金服在區塊鏈技術的隱私保護領域動作不斷,投資QEDIT研究零知識證明,並提出TEE 預言機技術方案。

支付寶向鋅鏈接介紹:「支付寶十分重視區塊鏈隱私保護技術領域,認為這個領域是未來各大區塊鏈平台競爭力的核心體現。支付寶從密碼學上的同態加密、零知識證明到基於硬體的可信執行環境(TEE)技術都進行了全面布局,並已經在不同的業務線上利用場景反覆打磨。」

百度於今年3月份上線了基於區塊鏈的數據流通平台XuperData。百度向鋅鏈接介紹,XuperData計算方案可以實現數據可用不可見,在保障數據隱私和安全的前提下實現組織機構信用數據共享。

「這一平台當前主要用於解決金融機構以及其他組織機構之間信息不對等問題,提升金融機構風控能力,減輕信貸風險,從而也解決企業特別是小微企業的貸款難的問題」。

互聯網巨頭紛紛湧入,數據共享與隱私安全保護這一賽道,註定越來越擠。

技術拆解:純密碼學與TEE硬體 密碼學的較量

在當前的區塊鏈基礎架構中,隱私保護功能往往存在著隱私性、可拓展性、鏈上計算三個維度的「不可能三角」,這意味著任意兩個維度都與第三者衝突。

區塊鏈的隱私協議也經歷了CryptoNote、Zk-SNARKs、TEE、MimbleWinble、以及Zether(Quorum)、MPC等的演進,應用範圍不斷擴大,從單純的保護加密貨幣交易隱私升級到數據共享的流通隱私。

隱私協議演進 鋅鏈接整理

當前國內大部分公司的隱私路徑採用MPC等純密碼學、TEE硬體 密碼學的兩種方向發展。純密碼學方向的主流做法是以MPC(安全多方計算)、零知識證明、同台加密等純密碼學方案,以PlatON、ARPA等項目為代表。

唐虹剛向鋅鏈接透露,MPC既能保證數據輸入各方隱私,又能輸出正確的計算結果,且是一個成熟的密碼學演算法,是完全可信的。TEE則是依賴可信第三方提供的硬體來解決安全計算問題,使用TEE則必須信任其生產廠商。

「PlatON已經對兩方計算進行了工程化實踐和商業應用,多方計算的技術解決方案也已經完成,正在推動工程化落地,加速MPC計算的專用計算硬體也在研發中。」

相對於MPC的純密碼學路線,所需長期的學術投入和技術商業化研究,TEE硬體 密碼學的方式則更容易實現商業化落地應用,當前國內大部分公司都採用的是TEE硬體 密碼學的方案,包括公信寶、趣鏈、螞蟻金服、百度XuperData等。

不同的公司項目採用的TEE硬體 密碼學的特點也有所不同。

支付寶方介紹,「TEE 預言機技術」是因為支付寶判斷區塊鏈要在產業大規模落地,還需要突破單條鏈的局限性,讓更多的鏈下實體參與進來,需要擴展出二層、三層的鏈下網路,與鏈上能力互補,形成新的協作網路。

百度稱,XuperData是通過區塊鏈構建一個去中心化的數據聯盟,「TEE或者安全多方計算是數據聯盟裡面支持的兩種安全計算方式,我們支持用戶選擇合適的一種來提供。」

趣鏈汪小益坦言,安全多方計算,就目前的技術手段來說,對參與方的數量是有限制的,三方相對可以的,但是往三方以上再去擴展,複雜度會呈現指數級上升。「我們認為目前這兩個技術可以並行來用,選擇最優的技術方案賦能具體應用場景。」

就當前所需的場景,通過多個TEE之間共同組成可信計算網路達成相應聯邦計算任務對於趣鏈來說,是更合理的一種技術路線。

由此,隱私技術協議的演化路徑反映了市場需求的方向,對於企業而言,自身商業模式選擇決定了他們所採用技術的發展路徑。

數據隱私安全領域的「現實妥協」

安全多方計算(MPC)的雛形可追溯到中國科學院院士、圖靈獎獲得者姚期智於1982年提出的百萬富翁問題,以及後續以混淆電路為主題的系列研究,姚期智是 Conflux 的聯合創始人和首席科學家。

Conflux 研究總監楊光向鋅鏈接介紹,由於適合在區塊鏈上使用的數據共享與數據隱私保護技術還不夠成熟,所以該領域目前不是 Conflux 項目最主要的突破方向。

據楊光介紹,安全多方計算、零知識證明、同態加密是以功能劃分的抽象概念,而不是具體的技術實現方案,每個方向都有基於不同密碼學技術的和基於 TEE 等可信硬體的多種方案。

「就像造汽車一樣,『汽車』是按照最終實現的功能定義的。具體是搞電動的還是燒油的,用哪種電池或者燒哪種油,發動機前置還是後置,都存在很多截然不同的技術路線。」

楊光認為,其實早在比特幣誕生之前,丹麥就已經開始大規模使用 MPC 技術解決社會問題。當時的MPC技術主要應用場景是只有兩個或少數幾個參與者,這跟區塊鏈上的應用場景差距很大,因此直接把現有技術搬到區塊鏈上必然會水土不服。

零知識證明技術也有類似的問題。因為零知識證明是基於互動式證明完成的,需要證明者和驗證者之間一來一回的頻繁互動才能向驗證者完成證明。但是在區塊鏈的應用場景下,不但難以進行多輪交互,往往還要求證明比較簡短並且可以被任何第三方(而不僅僅驗證者自己)公開驗證。

按照當前的研究水平,採用適合區塊鏈的實現方案會提高使用成本,大部分企業會選擇在鏈下進行交互運算,只把最終結果上鏈完成結算。

在技術尚未發展成熟的條件下,這也不失為一種可行的隱私保護方案,但這樣一來,隱私安全性也就打了折扣。

至於TEE硬體 密碼學的方式,楊光認為,這個方案本身非常簡單,唯一的缺點在於需要用戶相信硬體廠商等中心化節點。「但實際上,任何企業或者機構的可靠性都比不上完備的數學證明加上合理的安全性假設。想要正面攻破有嚴格證明的密碼學方案,需要解決某些很難的數學難題,這比搞定一家企業難多了。」

因此,純密碼學技術應用,目前不大可能實現大規模的商業化應用,而TEE 密碼學的使用,只是技術為現實應用場景需求的妥協罷了。

技術未滿,但需求規模卻不斷增長,而且需求緊急程度還不一樣。

汪小益認為,金融屬於信息化程度較高的應用場景,其次是政務、醫療。同時,物聯網在全面鋪開的情況下對隱私安全的需求越來越迫切,因此數據共享與隱私安全在這些領域呈現較強、較緊急的需求。

在趣鏈和PlatON的規劃中,區塊鏈技術與人工智慧技術的結合使用是未來可預見的發展方向。

唐虹剛則稱,未來PlatON會以隱私AI為重點發展方向,基於隱私計算實現的AI演算法分析,可消除數據源之間的交互壁壘,通過數據的多樣性來提升AI演算法的處理能力與數據覆蓋維度。

由最初的加密貨幣隱私協議向數據共享與隱私安全保護領域拓展,區塊鏈的隱私協議經歷了一系列的技術演進,在金融、政務、醫療、物聯網應用場景需求不斷爆發的今天,隱私安全計算的技術實現似乎心有餘而力不足。

然而,正如吳軍在《浪潮之巔》中對蘋果公司的評論:「喬布斯改變時間的發明絕非一時的靈感所致,而是數十年的深思熟慮和經驗積累......大部分產品經理之所以做不出改變世界的產品,是因為他們只看見了成功者最後的臨門一腳,而忽視了人的長期思考。

數據共享是趨勢,隱私安全是保障。如今技術未滿,不能完全解決兩者之間的矛盾,數據隱私安全領域只能做出「妥協」,但隨著技術不斷迭代,臨門一腳的那天或許已不遠了。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 鈦媒體APP 的精彩文章:

「十元店」市場掘金成功,名創優品衝刺IPO
用科技築造未來智能出行新場景,日產汽車加速汽車智能化變革

TAG:鈦媒體APP |