這個世界正變得更加真實,還是更多偏見?
造就第444位講者 車品覺
香港科學園董事
紅杉資本中國基金專家合伙人
我們正從一個低信息的時代,走進一個高信息時代。
低信息時代,我們看到的東西其實充滿了偏見和未知,比如在沒有谷歌地圖、百度地圖之前,我們並不知道今天是否會堵車,交通狀況到底如何。
我們擁有了前所未有的深度學習的演算法,也擁有前所未有的數據。
當我們把數據連接起來之後,我們看到的世界,與以前完全不同。
那是一個以往並沒有感知到的,比較客觀的真實世界。
在高信息的時代,我們可以還原一個真實、客觀的世界,可以對自己、企業、城市做出一個更好的一個預判。
但現實與理想總有差距,我們發現,在實際解決某個問題的時候,我們所擁有的數據是遠遠不夠的。
每天每個企業裡面收集了大量的數據回來,其中有很多是垃圾數據,並不能使用。
一面是龐大的數據在每天產生,一面是數據嚴重不夠使用,為什麼會出現這種兩極化情況呢?
過去在阿里做數據的時候,我們有兩套打法的,其中一種打法是,從問題出發去找足夠的數據來解決問題。比如淘寶要設計一個推薦引擎,最好的方法是同時拿到淘寶和天貓的數據,只有這樣才能達到很好的效果。
所以解決問題的邏輯是:因為需要做推薦引擎,所以我要打通數據,要有一個把數據匯總的方法或者架構。這是以「用」作為前提,打通數據、匯聚數據,即從問題出發看數據。
當數據量足夠的時候,我們也可以反過來看——比如我們發現,在淘寶裡面居然有人在11月買夏天的衣服。我們看了數據之後才發現,這些人其實在三四線城市裡做小批發的,他們並不是純C端的人。
所以,當你沒有這麼大量的數據的時候,你是沒有辦法去還原客觀事實的。
所以匯-通-用,到用-通-匯,這種兩種打法所需要的數據架構是不一樣的。
當問題很清楚,數據很中心化時,數據量越大,我們對一個東西的判斷的精準度會越高。
反過來說,問題是很清晰的,但是數據很離散的時候,我們治理數據的成本就會升高,把碎片化的數據組織在一起,這個成本比產出的價值可能更貴。
今天,我們已經進入了一個數字化的社會。目前,全世界有77億人口,其中66%在使用移動手機,有56%是互聯網的用戶,社交媒體、移動社交的用戶也幾近過半。線上購物、線上視頻、音樂,幾乎每個人都用過此類應用,可以說,在這個地球上有一半的人生活在數字化的世界。
我們回顧這十幾年整個大數據的進程,可以分為幾個階段——
2009年,我們開始聽見大數據這個詞;
2013、2014年,這是數據的蠻荒的年代,很多大數據產生並被企業使用,甚至從來沒有用過數據的企業,開始會使用大數據並從中得到價值;
2017年、2018年,我們已經開始認知數據安全這一問題,我們意識到,如果要整個數據行業、數據科學的可持續發展的話,我們必須要有更好的監管。
2012年,十二五國家的戰略裡面,已經開始對整個人工智慧、大數據產業給予一些指導方針。
一直到2015年,幾乎已經形成了一個中國大數據的頂層架構。
我們可以很明確的認識到,在整個智能 時代到底可以做什麼。直到此時,智能手機的滲透率已經非常高,同樣還有5G網路和雲計算。
未來我們需要做些什麼?
我們發現有一個領域是缺位的——開源技術生態,國內與美國相比,還差得很遠。而開源技術生態的缺位,使得我們無法出現類似Hadoop 、Spark等等可以影響到數據科學與人工智慧的平台。
另一個值得關注的缺位是數據的監管。
很多互聯網的圖片被拿去做深度學習,裡面也許會有一張你的照片,但是你並不知道你的照片被人用了,你連沒有反對的機會都沒有。當無人汽車遇到突髮狀況的時候,如何處理,決策權也不在你。
如果說這些離生活太遙遠,那麼下面的案例就與我們息息相關。
第一是排序系統,當你在查找某項信息的時候,為什麼你需要的沒有排在前面,反而是與它不相關的會排得更高呢?
第二是推薦系統,為什麼一些人會被推薦到某家公司面試,而另一些人卻不在裡面,其實這種演算法每天都在幫助你拿到更好的工作,或者是讓你沒有辦法得到某種工作。
第三,協同過濾。為什麼上個月忘了交電話費,突然之間你的某某指數就變低了?之後連貸款的能力也變小了呢?這些其實是我們無法控制的,卻與我們未來的生活息息相關的。
某種角度上來說,人工智慧和大數據其實充滿了傲慢,充滿了偏見。一方面它還原了一個更真實的世界,另一方面,它又導致了一個更加「偏見」的世界。
我們在未來要不要像這個人一樣拿把傘,讓這些東西不會傷害我們就足夠呢?
也許我們今天沒有答案,但是我們已經看到了一些好的方面,有的公司已經推出這樣的廣告(這也許是最微妙而美好的狀態)——
Your phone knows a lot about you, but we don』t.
你的手機知道很多關於你的數據,但我們不知道。
造就FUTURE是一場科技、文化、娛樂交融的思想盛宴,是一場藝術與科技交織的美妙盛宴。它是造就最為前沿的思想交流陣地,是一年一度的未來科技探討盛會。
文字 | 王銳
互動話題:
你在什麼時候覺得自己的隱私被泄露了?
每周評論區,被zan最多的評論者,將獲得造就送出的禮品一份
※如果現在發生地震了,你逃得掉嗎?
※創造力,常常就源於最底層的思考
TAG:造就 |