姚期智40年前提出,「百萬富翁」設想走進現實:這項隱私計算技術,將是下一個產業熱點?
兩個百萬富翁在街上相遇,他們都想知道誰更富有,但又不願意讓對方知道自己擁有的真正財富。如何在沒有第三方的情況下,讓對方知道誰更有錢?
這是姚期智院士在 1982 年提出的「百萬富翁」設想。看到這裡,不要認為這個設想和你沒有任何關係。
因為,這個設想的背後,本質上反映了基於用戶數據挖掘的服務(目前大多數互聯網公司提供的服務都涉及用戶數據挖掘)數據的使用權、所有權之間的矛盾:服務提供者必須得到你的數據才能提供服務。放到這個「百萬富翁」設想中,即互聯網服務一定要拿到兩位富翁的財產數據,才能計算出「誰更有錢」。
有沒有一種技術,可以實現數據使用權、所有權的分離,生產方保有數據的所有權而不影響數據需求方提供服務?簡而言之,可以基於加密的數據進行計算。
圖丨Protocols for Secure Computation 論文(來源:DeepTech)
在密碼學領域,這個問題可以描述成,「一組互不信任的參與方之間在保護隱私信息以及沒有可信第三方的前提下的協同計算問題」。也正是在《安全計算協議》(Protocols for Secure Computation)發表的一篇文章里提出「百萬富翁」設想的同時,姚期智發布了一個名為「多方安全計算」(Secure Multi-Party Computation,簡稱MPC)的理論框架。
在不久前接受《人民日報》採訪時,姚期智如此解釋 MPC:「我們兩個人中每個人有一個數據,想要兩個人數據合起來,但不想把數據交給對方。我們希望使這個計算實現,但是完全不透露我們的數據是什麼。我提出這個概念的時候,完全出於科學的好奇心。現在,這個方向成為密碼安全領域的一個大方向。」
姚期智認為,多方安全計算會在金融科技甚至人工智慧、醫藥保護共享數據等方面發揮重要作用。值得一提的是,姚期智在當時的採訪中表示,MPC 也將是中國貢獻給世界的一個原創關鍵技術。
圖丨姚期智,第一位也是唯一一位獲得圖靈獎(計算機領域最高榮譽)的華人計算機科學家,曾經任教於美國麻省理工學院、斯坦福大學、加州大學伯克利分校及普林斯頓大學,是公認的演算法、密碼學及量子計算專家。2004 年,他全職回國加入清華大學,目前是中國科學院院士、美國科學院外籍院士、清華大學交叉信息研究院院長(來源:人民直播截圖)
走出實驗室,MPC 的兩大應用價值
20 世紀 80 年代初,即 MPC 誕生的早期,研究者的關注點主要在於驗證這項技術的可行性上。
提出 MPC 的 4 年後,姚期智於 1986 年提出了基於混淆電路的通用解決方案,進一步驗證了多方安全計算的通用可行性,同時也奠定了現代計算機密碼學的理論基礎。此後,經 Oded Goldreich、Shafi Goldwasser 等密碼學學者進一步的研究和創新,多方安全計算逐漸發展成為現代密碼學的一個重要分支。
姚期智解釋,初期由於計算機的算力無法實現相應的計算,MPC 並沒有真正運作起來,但是現在,經過了三十多年的發展,「計算機終於足夠快,能夠把這三十年大家不斷改進的方案開始運作起來」。
今年 6 月,螞蟻金服演算法專家李漓春在公開場合表示,「了解到這個技術的時候,我就知道這個技術在大數據的時代特別有用。當年對這個技術了解的非常少,在業界應用也非常少。7年之後,現在我們看到很多公司都在做這方面的研究和探索,業界已經在落地」。
MPC 之所以近幾年開始受到關注,一方面是因為產業互聯網、AI 等關鍵領域的發展越來越離不開數據上雲、離不開數據挖掘,數據隱私問題的解決迫在眉睫。今年早些時候,加州大學伯克利分校(UC Berkeley)研究就發現,AI 的發展已經對健康數據的隱私造成新的威脅,但是目前的法律遠不足以保護個人健康數據的隱私性。
另一方面也在於,MPC 已經成長到了一定的階段,其產業價值潛力開始彰顯,特別是在涉及隱私敏感型輸入數據(如客戶行為信息、身份信息、金融信息、徵信信息、醫療信息)的應用場景。
擁有隱私敏感型數據的金融、物流、供應鏈、物聯網、汽車業,都會是 MPC 很有應用價值的地方。而且,在解決數據隱私問題的同時,數據孤島的困境也能得到緩解,因為一部分數據孤島現象存在正是基於數據隱私的考量。
尤其對於以海量數據作為訓練根基、正在隱私保護合規中尋求落地的 AI 技術來說,這將是一個好消息。
(來源:互聯網)
以醫療場景中的基因數據為例,基因數據具有隱私性要求高、數據體量大的特點。此前就有業內人士表示,「生物信息是個人信息安全的最後一道防線」。目前,基因數據一般會保存在研究機構或者醫療公司的本地系統中,但這些「新石油」處於共享、流通的狀態其實才更利於生物醫療技術的發展,例如基於基因數據挖掘研究某種疾病,開發出更有針對性的藥物等等。
如果不同的機構能夠部署 MPC 節點,那麼,這些數據就可以通過 MPC 協議間接實現數據共享:基因數據仍保留在本地,但是不同的機構可以共同實現計算出需要的數據結果。
類似的項目已經在國內出現。2018 年,民生健康(萬向區塊鏈和民生人壽保險有限公司共同成立)就和寧波保險行業協會合作,以健康險為業務場景,模擬聯盟內保險公司之間的數據查詢,證明了 MPC 在建立共享價值網路上是完全可行的。不過,需要指出,由於模擬的數據規模較小,那個項目並沒有產生實際的商業價值。
而作為 MPC 的提出者和重要奠基人,姚期智所在的清華交叉院,也有一支團隊正在探索 MPC 的實際應用。據 DeepTech 了解,2018 年 6 月,一支清華交叉院背景的團隊成立了華控清交信息科技(北京)有限公司(下稱「華控清交」)。
(來源:華控清交)
華控清交由清華大學、清華大學交叉信息研究院和清華五道口金融學院聯合發起,專註於研究、開發和營運基於密碼學的MPC技術、標準和基礎設施,公司 CEO 為前高盛全球合伙人張旭東,團隊的大部分成員是清華交叉院背景。
這個團隊通過綜合運用密碼學混淆電路、不經意傳輸、秘密分享、同態加密、同態承諾、零知識證明等多種理論和協議,結合計算機工程技術,研發出了一個軟硬體結合的多方安全計算平台。據介紹,這個計算平台可以在多方輸入且不暴露輸入信息的情況下進行密文計算,最終得出與明文一致的密文計算結果,可支持涵蓋AI演算法訓練在內的幾乎全部計算類型和多種數據格式。目前,華控清交已經在金融行業多方聯合風控、多方聯合建模,能源行業風電效率優化、政府領域電子政務等場景有具體落地和試點項目。
(來源:華控清交)
除了華控清交以外,國外公司如麻省理工學院背景的初創公司 Enigma,國內公司如螞蟻金服、ARPA 等,也已經在探索 MPC 和產業的結合,今年都已經一些階段性成果發布。
以螞蟻金服為例,早在 2012 年,螞蟻金服就開始研究 MPC。今年 5 月,螞蟻金服推出其基於 MPC 的安全計算平台「摩斯」,據稱提供了一種全新的安全和保護隱私的數據合作方式,能夠在本地數據不泄露、原始數據不出域的前提下,通過密碼學演算法,分散式執行既定邏輯的運算並獲得預期結果,高效、安全地完成數據合作。目前,「摩斯」已廣泛應用於聯合金融風控、保險快速理賠、民生政務、多方聯合營銷、多方聯合科研、跨境數據合作等多個領域。
(來源:螞蟻金服)
與區塊鏈互補的天然屬性
有意思的是,關於 MPC 的應用,談論最多也最被看好的一個方向就是它和區塊鏈相結合。
MPC 本身和區塊鏈頗有淵源。兩者本質上都屬於密碼學領域的技術。不過,MPC 是通過一系列的數學函數來實現輸入數據的加密、保護數據隱私而不影響計算結果,其基本思想包括混淆電路、秘密分享、同態加密等。
乍看之下,MPC 似乎與區塊鏈非常相似:兩者的目標都包括保護數據、理論根基是密碼學、實際部署採用多節點分布……但事實上,兩者有非常大的不同。
最大的區別就在於,區塊鏈的計算過程中並不考慮輸入數據的保密性,這些輸入數據在鏈上都是透明的、可追溯的,這在追求數據透明的應用場景如食品安全溯源自然是常規操作,但在某些場景下,輸入數據有一定的機密性,不透明反而是需求。而MPC強調計算過程中輸入數據的保密性,輸入數據被鎖在「黑箱」里。
也正因為兩者在輸入數據上的這種互補屬性,兩者的結合是一種新的技術趨勢:區塊鏈經過 MPC 獲得數據保密能力,可以覆蓋更多的應用場景;MPC藉助區塊鏈技術實現冗餘計算變得可驗證。螞蟻金服副總裁總經理劉偉光就曾在接受媒體採訪時稱,區塊鏈技術如果不和 MPC 結合,還不足以支持金融場景。
目前一些區塊鏈初創公司也在研究 MPC 和區塊鏈的結合,例如共識數信。現實中已經出現了一些 MPC 和區塊鏈結合的應用。例如 ZCash 通過零知識證明的手段在 Bitcoin 上添加了保護交易隱私的功能。在加密貨幣之外的領域,比如聯合徵信、醫療數據聯合建模、拍賣清算、廣告推薦等應用場景,區塊鏈做存證 MPC做隱私保護就是一個很好的解決方案。
但需要指出,作為一種新的密碼學協議和工具,MPC 近幾年才開始走出實驗室,有了非常小規模的應用案例,現在仍處於一個非常早期的階段,尚無特別成熟的產品,實際落地的過程中,其商業可用性還有待持續驗證。因為,一種新的技術必須要結合場景工程化才能發揮作用。
另外,由於 MPC 的分散式計算環境涉及非常多的計算和交互,MPC在實際應用的過程中,還需要進一步提升性能和效率。
隱私計算技術將是下一個產業熱點?
MPC 走出實驗室、受到產業關注背後,一個更大的行業趨勢是「隱私計算」的興起。
圖丨隱私計算主要技術方向(來源:通證通研究院)
隱私計算,廣義上指的是面向隱私保護的計算系統,涵蓋數據的生產、存儲、計算等信息流通過程。隱私計算的發展驅動力,很大一部分來自外部的監管環境(因為去年 3 月的數據濫用醜聞,Facebook 被罰了50億美元)。換句話說,各國政府的監管越嚴格,隱私計算的市場就越大。從行業趨勢上來看,Gartnre 已經將數據隱私列為 2019 年十大戰略技術趨勢之一。
不如看看隱私罰單下的矽谷科技巨頭們正在做什麼吧。今年 6 月,作為支持用戶隱私和安全的一部分,谷歌就發布開源 MPC 工具 Private Join and Compute,以幫助組織機構更好地處理機密數據集。
谷歌工程總監 Sarvar Patel 、研究科學家 Moti Yung 在公開文章中表示,還會繼續投入新研究促進在有價值的數據洞察的同時保留個人隱私,「通過更加廣泛地分享技術,我們希望能夠擴展安全計算的使用案例。而這不過是一切可能性的開始階段」。
而據第一財經的報道,前陣子推出了轟動全球的數字貨幣「Libra」的 FaceBook,很有可能也在押注 MPC。據報道,目前 Libra 已經公布的內容尚不包括這部分內容,但 從Facebook 多位核心工程師的簡歷來看,Facebook 也正在進行相應的研究和開發工作。這項技術在未來的數字經濟版圖中將屬於具有戰略意義的技術。
近期,麻省理工學院數字貨幣計劃區塊鏈研究高級顧問 Michael J Casey 也在 CoinDesk 發文稱:「密碼學的一個非常重要的領域——MPC——取得了一些重大進展,這表明在分散系統中,可用性和安全性都是一個潛在的聖杯」。他所提到的進展,指的是區塊鏈公司 KZen 公布的新款 ZenGo 錢包,該錢包使用 MPC 和其他複雜的加密工具(如零知識證明和閾值加密),在一組不信任的實體之間共享對特定加密貨幣地址的簽名責任。
不過,在這篇名為《MPC 闡釋:保護加密貨幣的大膽新願景》的文章中,Michael J Casey 也強調,認為 MPC 或任何相關技術可以為安全問題提供完美、完全無誤的解決方案是不明智的,「當人們自滿地認為安全不是威脅時,安全威脅就會出現」。
現在,企業的數字化轉型、行業的智能化轉型還在轟轟烈烈地發展,挖掘更高維度的數據價值以及數據上雲的過程中,數據隱私的擔憂大概率只增不減,以 MPC 為典型的隱私計算技術值得關注,亦值得布局,尤其是中國企業。正如姚期智院士所期望,MPC 也將是中國貢獻給世界的一個原創關鍵技術。
-End-
參考:
https://www.coindesk.com/multiparty-computation-cryptocurrency-security
https://www.zdnet.com/article/google-open-sources-private-join-and-compute-a-tool-for-sharing-confidential-data-sets/
關注 DeepTech
發現改變世界的新興科技
(微信號:deeptechchina)
※智能科技引領發展,來CNCC掀起一股思維風暴
※打破僵化定義,探索新興科技如何改變未來世界
TAG:DeepTech深科技 |