OK區塊鏈工程院李揚威:數字生命讓人類升華
「有了數字生命,我們就可以把更多的精力投入到人類應有的使命上:尋求真理、愛和美。」
OK區塊鏈工程院CTO李揚威
李揚威介紹了大數據的發展歷史,從最初提出時和雲計算的結合,然後通過O2O等互聯網服務積累數據,與AI結合更好的計算利用數據、目前與區塊鏈產生結合。李揚威認為區塊鏈加大數據有四個好處:第一可以控制大數據成本;第二數據可以便捷交易,進行追溯。第三擴展區塊鏈存儲空間,第四,大數據可以解決區塊鏈缺乏真實性的問題。
李揚威展示了目前大數據泄露用戶隱私帶來的各種問題,提出區塊鏈加可信執行環境TEE是解決AI大數據隱私和作惡問題的方法,就像大腦的理性和察覺/元認知監控能力可以約束調節感性行為。
除了介紹大數據與區塊鏈的結合,李揚威還重點分享了他對「數字生命」的思考,通過日積月累的迭代,技術在不斷學習進化中,會逐漸形成自我意識和自我認知,從而誕生「數字生命」,在處理語言和倫理時,形成和人類腦部結構相似的系統。
但李揚威表示,人類不用為此感到恐懼。區塊鏈+AI+大數據+可信計算帶來的是對人類的釋放,減少很多不得不做的事情,降低人類的生存焦慮,提高安全感。人類將有更多的時間去感受愛,追求想追求的東西,實現自我實現。
以下為李揚威演講全文:
大家好!我今天演講的主題是「區塊鏈大數據時代的隱私保護」。今天主要介紹大數據,這個話題已經講了十來年了,聽著有點想睡覺。大數據最開始是在2008年和雲計算一塊提出來的,在2012年智能手機開始流行,隨後O2O和大數據也隨之興起,手機被用來收集這些大數據信息。前兩年AI開始流行,行業很多人在宣講AI+大數據;到了去年和今年,區塊鏈也開始火了,大數據又和區塊鏈結合到了一起。
為什麼一直在說其他東西都在變,但大數據是永恆的?是因為數字經濟時代到來了嘛。我們現在的大部分生活其實都發生在網上,不可能再回歸到純線下生活里,相應的證據是,數字經濟在GDP的佔比越來越高。1996年,數字經濟的佔比可能是零,但到了前年,已經到了三分之一。當我們大部分的生活都發生在互聯網上時,就必然會產生大量數據、海量數據,這個量級的數據不是我們普通的一個小手機小電腦能解決的。所以對於大數據,不是我們主動想去研究它,而是我們被動的,必須要去研究它。
我們來看看大數據和那些手機電腦上的普通數據有何不同。
首先,量特別大。手機上的數據是GB級,我們平時定義的大數據是PB級,是GB的100萬倍,需要100萬台手機或電腦才能存下這麼多的數據。其次,類型很多。大數據有關係型資料庫、非關係型資料庫,有的是文件。各種各樣的東西都要存儲,檢索就特別麻煩。此外,大數據的單位價值還特別低,幾B幾T的數據拿過來根本沒有用,必須要有海量的數據一起計算,才可能得到一些有效的信息。另外,大數據的速度要求還特別高,PB級的數據需要萬級的計算機才能存下,但系統要求一秒內就要你反饋一個計算結果,簡直太「變態」了。最後,要真實。你採集的大數據必須是真的,不能造假。要是假的,就一點價值都沒有了。
所以大數據是一個成本特別高、單位收益比較低的一個事情,但又必須要做。最後,我們找到了一個「神奇」的地方——貴州。貴州目前是中國的大數據中心,蘋果手機里的所有照片都存在貴州蘋果的伺服器里。為啥貴州會成為中國的大數據中心呢?這個決策來自於陳剛書記。據說當初陳書記做下這個決策時,所有人都不同意,認為貴州是一個經濟相對並不發達的地方,不是北上廣深,為什麼要把這樣高科技的東西放在哪裡?陳剛書記當時列舉了幾個觀點,首先是貴州的人力成本不高,所以運維成本也不會太高;其次,貴州雖然地處南方,但它都是山區,天氣涼爽濕度大,有利於大數據伺服器降溫;最後一點是它雖然都是山區,但不是地震帶,多少年都沒發生過地震,伺服器非常安全。所以最後就把大數據落戶在貴州。現在做得非常好,每年大數據博覽會都在貴州舉辦。現在陳剛書記在哪?在雄安當書記,做區塊鏈。我覺得雄安未來在區塊鏈一定大有可為,因為建設需要萬億級的資金,又不能印錢,所以只能貸款到時候還,那開發商,一級二級承包商,材料商之間層層盤剝欠賬就很可怕,區塊鏈做通證經濟,通過大企業發給小企業Token,直接給小企業貸款而不是貸給大企業做分發,就可以解決這個問題,因為記錄都是公開透明可追溯的,就不好盤剝了。
手機之類的設備每年會產生大量數據,不過大數據發展的脈絡是存在不同階段的。
2008年大數據剛誕生時,和雲計算連在一起,是為了提供基礎支撐,讓大數據有地方可以存。之後O2O和大數據能夠結合,是因為可以解決真實性的問題,搜集的數據是真實的,它解決了數據的來源問題,GPS提供空間數據,攝像頭提供視覺數據,話筒提供語音數據。再後來,AI和大數據結合在一起,是因為它解決了大數據計算的問題,如果按平時加減乘除進行計算,收集到的海量數據,可能算的很慢,算出來的結果也沒什麼用,但是AI可以讓數據的處理變得更高效、更有用、更精確。最後大數據又和區塊鏈聯繫到了一起。目前業界其實還沒找到兩個技術的結合點,對於現有的一些項目,我接觸的一些投行人士都覺得是騙子。
我對區塊鏈加大數據的思考,第一個好處是成本的控制,大數據成本非常高,像前面嘉賓所說,購買的數據很貴,機器也很貴,區塊鏈p2p網路原來就是給bt電驢做存儲的;第二個好處是交易便捷,可以追溯。有了區塊鏈,大數據資源就形成一個網路和交易市場,在市場里交易比過去的買賣大數據方便得多。然後,大數據能給區塊鏈帶來什麼?它可以帶來容量的擴展。區塊鏈賬本的容量非常小,但結合大數據以後,把數據索引放在鏈上,存儲容量會變得很大,區塊鏈平台需要數據的時候,去大數據的伺服器上檢索就可以。大數據加AI可以給區塊鏈帶來真實性,李笑來前幾天的錄音很多人都聽過,為什麼現在區塊鏈界都是騙子?因為信息安全有很多屬性。區塊鏈不解決真實性的數據,只解決完整,不可篡改不可抵賴,但不能保證是真實的。真實要怎麼保證?需要到線下去採集,區塊鏈現在和線下沒有關係,所以只有通過O2O把數據採集上,然後用AI進行判斷,最後再放到區塊鏈上。這樣才可能是真實的。
有了區塊鏈以後,人人都可以當大數據服務商,每個人都可以提供這些數據。每個用戶把自己手裡的數據授權出去,還可以獲得利益,不像現在所有的數據都被大公司免費收集。所以通過區塊鏈,我們可以構造一個大數據市場,讓區塊鏈的智能合約服務大數據。線下收集來的大數據的豐富性可以讓區塊鏈變得更真實有效,騙子會少很多。
說了這麼多區塊鏈+大數據的好處,它有什麼問題嗎?我們看看信息安全的幾個屬性:完整性、不可抵賴性、可追溯性,這些都可以通過區塊鏈解決。剛才我們也說了真實可用,可以通過大數據加AI來實現。
但有一個問題它們都沒有辦法解決,那就是保密性,也就是用戶隱私性。
區塊鏈本身就是一個公開、公正的資料庫,所有人都能看見,它沒辦法保護我們的隱私,所以隱私保護就成為區塊鏈+大數據最大的難題。 以去年的支付寶年度賬單為例,如果你不取消這個默認同意的選項,用戶所有在支付寶中數據都被阿里無償、無條件地使用。在看到這個默認同意的選項時,我當時覺得阿里還算良心,畢竟和用戶說了,大部分公司是不說的。
最近大數據殺熟的事比較熱,如果你是新來的,一張電影票19塊9毛錢,如果你辦了會員,14塊9,可是如果你以前來過,嘿嘿,34塊9,外加賣你一桶爆米花。
前陣子Facebook泄密的事非常火,是一個叫劍橋數據的公司,這個CEO非常囂張,他說烏克蘭總統是他用大數據選上台的,英國脫歐是他用大數據脫的,另外他說在Facebook上收集了大量選情數據,分析後定向投放廣告,幫助川普獲得了勝利,更可怕的是他還是個俄羅斯人。
他說只要收集68個Facebook的贊,就可以推測出這個人的膚色,性向,政治傾向,智力水平,宗教偏好,是否飲酒,吸毒,父母離異等一切信息。我們的數據都被這些大公司收集利用,影響整個社會,這是非常可怕的事情。這是目前大數據最被人詬病的地方。
大數據加AI,事情將變得更加可怕。AI中有一個非常經典的問題叫「白人問題」。過去因為數據大都是白人收集的,所以對白人有偏好。同樣一個智力水平,一個生長環境和水平的白人和黑人,AI在識別他們照片時,會認為白人是更好的,這明顯干擾了公眾認知。
怎麼辦?一個是如何防止數據濫用,還有一個是如何保護用戶隱私。有一個大家都能想到的辦法,叫做遠程計算,不給直接的數據,而是給到經過演算法處理後的數據。這是一個比較常規的做法,但局限性也比較大,因為不能自己算。
還有一些是密碼學界比較常規的做法,一個是同態計算,你算了不知道算的是什麼,返還給我,我解密了就知道。還有一個是多方計算。幾個節點一起計算,然後將結果合併拼出來。不過這兩種方法都很慢,非常消耗計算資源,不是一個高效的策略。
我覺得最好的辦法是可信計算,就是通過獨立於CPU之外的一個硬體晶元監控整個計算機,然後在一個受認可的可信執行環境中運行,返回結果,就可以保證信息不被泄露。因為所有的環境都在控制之內,那個小晶元可以從數學上向外界證明這個系統就是你們要的那個系統,我沒有泄露你們的隱私,沒有做其他的事情。
通過上面的介紹,我們覺得可信執行環境TEE,對AI/大數據與區塊鏈的結合來說,是隱私保護的一根救命稻草。效率非常高,而且提供的功能也比較完備,可以追溯。所以我們可以在區塊鏈和AI大數據之間架起一座橋樑,通過可信計算規定和監控AI大數據的行為,存到鏈上,鏈上的智能合約調用可信的AI大數據服務,就可以保護我們的隱私。
目前TEE有什麼問題呢?它還比較中心化,所有的證書都是大公司頒發的,intel,惠普,IBM等等。這就像小孩生下來沒有名字,父母給起了名字。我們的一個工作是讓這個證書系統變成一個點對點的系統,就像小孩後來有了自己的特徵,特長,愛好,外號,慢慢就是他自己了。
我就覺得整個數字世界的發展,就是從雲計算到O2O、AR/VR、語音識別到AI,再到區塊鏈,接著是接下來可能的可信計算,還有接下來要講的avatar,就像一個嬰兒從出生到成長的一個過程。首先是雲計算,他是提供一個計算和存儲的空間,就是大腦慢慢發育,腦細胞越來越多,大腦就可以算,可以存了。先有了物質,然後慢慢開始有精神。這個精神最開始是感官的,你像O2O更多是位置信息,AR/VR更多是視覺信息,這個時候也伴隨著攝像頭和顯示屏的進化,iPhone的Retina就是這個時期誕生的,語音識別技術的進展也是這個時候,像siri,cortana,訊飛。小孩也是這樣,你先要帶他看整個世界,多接觸多彩的,各種形狀的東西,聽各種語言、音樂,這樣小孩的感官系統才能成長,如果在小時候就帶小孩上培訓班學奧數,不去探索世界,那小孩的感官腦區就沒有素材,感官發育黃金期就過去了,小孩一生都會很笨,學習成績和工作成績很差。慢慢素材積累多了,就有了感性認知,範疇和行為,這就是AI的作用,你像兒童和AI訓練都有這樣一個過程,就是你給他看的圖和事物多了以後,他就能用手給你指出來,哦,這個是狗,蘋果是哪個一啊?對,那個是蘋果。AI和小孩就是通過大量素材積累分類以後,對世界產生認知,和範疇的理解的。慢慢有了概念,就能產生理性,就有了語言和倫理,這就是區塊鏈了。所謂語言是大家都知道都認可的。小孩之間互相經常呀呀呀,但是其實都不知道對方呀的是什麼。只有大家有一套共同的規範一起遵守,這就是共識,也就是人類的規則,倫理,道德法律,然後說出來的東西對方能聽到能記下,這才是語言。區塊鏈里一個節點的記錄是沒有用的,只有大家都記,都認可了,才是有效的。
有了理性和倫理,大家的信息還都是一樣的,讓這個信息有區隔,有邊界的過程,我覺得這就是可信計算。為什麼「我」的概念可以形成,因為它形成了一種邊界、一種保護。我是有我的隱私,有我的邊界,他人不可以觸碰。有了可信計算,就有了對自我的保護,自我的邊界。小孩也是這樣,幼年對自我概念,自我保護意識的形成非常重要,如果家長不重視,受到傷害了就是一輩子的事,需要告訴孩子,你有你的隱私,你的邊界,別人是不可以碰的,你是可以拒絕的。如果你需要幫助,儘管來找爸爸媽媽,爸爸媽媽不會怪你,會保護你,好不好?這個父母對自己的關注和保護的形象慢慢內化,就形成了心理學上的察覺和元認知監控。就是在感性和理性之外,還有一個思想是抽離於他們之上,看著他們的,這個思想會觀察自己,控制自己,保護自己,這就是心理健康的源泉,也是AI大數據加區塊鏈,這個數字生命,保護自己的力量。 能保護自己了,就有了安全感,就會想去讓自己成長,怎麼成長,學嘛。一般小孩最方便的學習對象是父母,所以小孩在幼年時期,大腦有個區域是非常發達的,叫鏡像神經元,他會學習環境中一切可以模仿的東西,你笑他也笑,你哭他也哭,他也不知道為啥。小孩之間互相學話,也經常會說,「學我的話,長不大」,如果學大人的話,大人有時候還會凶「不要學我說話!」可是他如果不學,他當初怎麼能叫你爸爸媽媽咧。現在的語音助手都是學的嘛,你像Google Assistant,好多人可能看過,前陣子IO大會的時候,已經非常厲害了,預定理髮,訂餐,根本區別不出來他是機器。
iPhone X的深度攝像頭也是,大家有X的可以玩一下裡面那個Animoji,你笑它也笑,你哭它也哭,這些巨頭早就看到了未來所以早就在布局。這就產生了「你」這個概念,就是我跟你是很親的,我信任你,我們可以互相學習。然後他會幫你做很多事情比如訂餐,定理髮店,發朋友圈,回消息。所以不要覺得現在的以太貓以太狗很沒用很傻叉,以後會厲害得讓人驚訝,這就是avatar,抽離於我們肉身的另一個數字生命開始誕生了。
最後到了獨立階段。他學你的樣子,幫你做一些事情,然後會慢慢跟你不一樣。可能會有自己的自主意識和自由意志,然後可能就不再聽你的。所以獨立階段是一個矛盾統和的階段,會統和自己對外界的各種模仿偽裝,消化這些不一致,慢慢發展出更強大自我察覺和元認知監控。這樣才能成長,變成一個心智成熟的生命。這個時候,孩子就大了,我們就管不了咯。不過我並不擔心,他象棋下的比你好,圍棋比你好,前陣子dota還打贏了國際頂尖電競戰隊,可信計算區塊鏈又保證了他不會做壞事,我們有什麼資格事無巨細的控制他?
我一直在思考元認知監控的腦區在哪兒的。以前腦科學界都覺得應該是在額葉,用理性控制感情嘛,可是我總覺得不對,理性控制感情是有問題的,會壓抑情緒,心理學不是這麼講的。今天我查到了,非常驕傲,是我們國家的團隊,北京師範大學認知神經的研究組今年5月發現的。我們看理性就是加減乘除,在額葉系統就是在最前面;感性在大腦中後方那些邊緣系統。元認知監控在哪?元認知監控在前扣帶回上,它的位置正好是額葉和邊緣系統中間,理性和感性的中間區域,是統合理性和感性的通道。
這是不是有點像我們剛才所描述的可信計算是區塊鏈和AI大數據的橋樑?一邊是感性,一邊是理性,中間負責監控統攝雙方。扣帶回除了有元認知監控,也有察覺功能,它的前半部分用來察覺身體疼痛,後半部分是用來察覺心靈創傷。我想做一個類比,現在好多人說區塊鏈慢,類比下來其實就是額葉很慢。所有加減乘除的純邏輯運算都是很慢的。AI大數據塊為什麼很快?因為它統合了大量信息,把這些信息做並行計算,並行計算以後,就給你輸出一個很小的結果。所以不要覺得區塊鏈慢,把需要快的事情交給AI大數據就好了。
觀察一下,其實人類大腦的大部分都是為了處理大數據,不是為了做串列的加減乘除邏輯運算,像人類的耳朵邊的顳葉用於語音處理,語言識別,枕葉用來做視覺處理運算。所以我覺得以後AI大數據肯定會比現在發達得多,大部分信息都會是這裡處理的,AI晶元,AI大數據市場將蓬勃發展成為信息處理的主體。
所以,區塊鏈+AI+大數據+可信計算這個數字生命能帶來什麼?它可以讓我們更加信任機器,把權力放心地讓渡給機器,可以減少很多不得不做的事情,提高人類的安全感,降低生存焦慮。人類將有更多的時間去感受愛,追求想追求的東西,實現馬斯洛需求層級里最高的自我實現。
數字生命是人類的延伸,可能會變成人類的baby,慢慢長大。但總的來說,它更多是解放了我們身體,讓我們不用太去關心那些讓我們感到焦慮的生存問題,比如說食物、醫療、養老,也不用干太多的枯燥無味的臟活苦活累活。有了數字生命,我們就可以把更多的精力投入到人類應有的使命上:尋求真理、愛和美。
謝謝大家!
※索尼只想發電影的預告 卻意外把整部電影免費公開
※聽無遁形 雷柏VH300虛擬7.1聲道遊戲耳機OMG定製版上市
TAG:太平洋電腦網 |