當前位置:
首頁 > 天下 > 這個世界正變得更加真實,還是更多偏見?

這個世界正變得更加真實,還是更多偏見?

造就第444位講者 車品覺

香港科學園董事

紅杉資本中國基金專家合伙人

我們正從一個低信息的時代,走進一個高信息時代。

低信息時代,我們看到的東西其實充滿了偏見和未知,比如在沒有谷歌地圖、百度地圖之前,我們並不知道今天是否會堵車,交通狀況到底如何。

我們擁有了前所未有的深度學習的演算法,也擁有前所未有的數據。

當我們把數據連接起來之後,我們看到的世界,與以前完全不同。

那是一個以往並沒有感知到的,比較客觀的真實世界。

在高信息的時代,我們可以還原一個真實、客觀的世界,可以對自己、企業、城市做出一個更好的一個預判。

但現實與理想總有差距,我們發現,在實際解決某個問題的時候,我們所擁有的數據是遠遠不夠的。

每天每個企業裡面收集了大量的數據回來,其中有很多是垃圾數據,並不能使用。

一面是龐大的數據在每天產生,一面是數據嚴重不夠使用,為什麼會出現這種兩極化情況呢?

過去在阿里做數據的時候,我們有兩套打法的,其中一種打法是,從問題出發去找足夠的數據來解決問題。比如淘寶要設計一個推薦引擎,最好的方法是同時拿到淘寶和天貓的數據,只有這樣才能達到很好的效果。

所以解決問題的邏輯是:因為需要做推薦引擎,所以我要打通數據,要有一個把數據匯總的方法或者架構。這是以「用」作為前提,打通數據、匯聚數據,即從問題出發看數據。

當數據量足夠的時候,我們也可以反過來看——比如我們發現,在淘寶裡面居然有人在11月買夏天的衣服。我們看了數據之後才發現,這些人其實在三四線城市裡做小批發的,他們並不是純C端的人。

所以,當你沒有這麼大量的數據的時候,你是沒有辦法去還原客觀事實的。

所以匯-通-用,到用-通-匯,這種兩種打法所需要的數據架構是不一樣的。

當問題很清楚,數據很中心化時,數據量越大,我們對一個東西的判斷的精準度會越高。

反過來說,問題是很清晰的,但是數據很離散的時候,我們治理數據的成本就會升高,把碎片化的數據組織在一起,這個成本比產出的價值可能更貴。

今天,我們已經進入了一個數字化的社會。目前,全世界有77億人口,其中66%在使用移動手機,有56%是互聯網的用戶,社交媒體、移動社交的用戶也幾近過半。線上購物、線上視頻、音樂,幾乎每個人都用過此類應用,可以說,在這個地球上有一半的人生活在數字化的世界。

我們回顧這十幾年整個大數據的進程,可以分為幾個階段——

2009年,我們開始聽見大數據這個詞;

2013、2014年,這是數據的蠻荒的年代,很多大數據產生並被企業使用,甚至從來沒有用過數據的企業,開始會使用大數據並從中得到價值;

2017年、2018年,我們已經開始認知數據安全這一問題,我們意識到,如果要整個數據行業、數據科學的可持續發展的話,我們必須要有更好的監管。

2012年,十二五國家的戰略裡面,已經開始對整個人工智慧、大數據產業給予一些指導方針。

一直到2015年,幾乎已經形成了一個中國大數據的頂層架構。

我們可以很明確的認識到,在整個智能 時代到底可以做什麼。直到此時,智能手機的滲透率已經非常高,同樣還有5G網路和雲計算。

未來我們需要做些什麼?

我們發現有一個領域是缺位的——開源技術生態,國內與美國相比,還差得很遠。而開源技術生態的缺位,使得我們無法出現類似Hadoop 、Spark等等可以影響到數據科學與人工智慧的平台。

另一個值得關注的缺位是數據的監管。

很多互聯網的圖片被拿去做深度學習,裡面也許會有一張你的照片,但是你並不知道你的照片被人用了,你連沒有反對的機會都沒有。當無人汽車遇到突髮狀況的時候,如何處理,決策權也不在你。

如果說這些離生活太遙遠,那麼下面的案例就與我們息息相關。

第一是排序系統,當你在查找某項信息的時候,為什麼你需要的沒有排在前面,反而是與它不相關的會排得更高呢?

第二是推薦系統,為什麼一些人會被推薦到某家公司面試,而另一些人卻不在裡面,其實這種演算法每天都在幫助你拿到更好的工作,或者是讓你沒有辦法得到某種工作。

第三,協同過濾。為什麼上個月忘了交電話費,突然之間你的某某指數就變低了?之後連貸款的能力也變小了呢?這些其實是我們無法控制的,卻與我們未來的生活息息相關的。

某種角度上來說,人工智慧和大數據其實充滿了傲慢,充滿了偏見。一方面它還原了一個更真實的世界,另一方面,它又導致了一個更加「偏見」的世界。

我們在未來要不要像這個人一樣拿把傘,讓這些東西不會傷害我們就足夠呢?

也許我們今天沒有答案,但是我們已經看到了一些好的方面,有的公司已經推出這樣的廣告(這也許是最微妙而美好的狀態)——

Your phone knows a lot about you, but we don』t.

你的手機知道很多關於你的數據,但我們不知道。

造就FUTURE是一場科技、文化、娛樂交融的思想盛宴,是一場藝術與科技交織的美妙盛宴。它是造就最為前沿的思想交流陣地,是一年一度的未來科技探討盛會。

文字 | 王銳

互動話題:

你在什麼時候覺得自己的隱私被泄露了?

每周評論區,被zan最多的評論者,將獲得造就送出的禮品一份

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 造就 的精彩文章:

如果現在發生地震了,你逃得掉嗎?
創造力,常常就源於最底層的思考

TAG:造就 |