對話ACM圖靈獎獲得者:大部分數據泄露都是內部員工造成的?
如今,大數據對所有行業都產生了深遠影響:從醫療保健、汽車、電信到物聯網。隨著數據浪潮的持續,企業都在尋找更新的管理和分析方法、收集可行的見解並應對安全和隱私的雙重挑戰。
計算機協會(ACM)剛剛結束了ACM A.M.50年的慶祝活動。圖靈獎(俗稱「諾貝爾計算獎」)在舊金山舉行了為期兩天的會議。會議彙集了一些計算行業的翹楚,探討計算機的未來發展以及該領域的領先地位。以下是與麻省理工學院計算機科學與人工智慧實驗室(CSAIL)兼職教授Michael Stonebraker的對話,其是ACM 2014圖靈獎的獲得者。
問:Gartner估計,目前有大約49億台物聯網設備(汽車,家用電器,工業設備等)可以生成數據。預計到2020年將達到250億。你認為這一波數據帶來的主要挑戰和機遇是什麼?
Michael Stonebraker:從我的觀點來看,大數據有三個潛在的問題,可以分成三個「V」。首先是volume(規模)問題,意味著如今企業有太多的數據;其次是velocity(速度)問題,數據來臨的速度太快;最後是variety(類型)問題,數據來源太多,數據類型繁雜。我們來分別看一下這三個V。
如果企業存在規模問題,並且只對在大量數據上運行SQL風格的商業智能感興趣,那麼在數據倉庫中,至少有幾十個生產倉庫正在進行中。在這方面,如果企業只想做商業智能,那麼規模問題基本上是可以解決的。
第二個「V」(速度)也是相當簡單,如果處理一百萬條消息希望是一秒鐘,當前的流處理引擎完全可以滿足這一點。就我目前所知道的而言,這個速度已經足夠快了。當然,隨著社會的發展,未來可能會對速度有更高的要求,但我並不認為速度問題很難解決。
第三個「V」(類型),我認為多樣化才是真正的問題。當數據有太多不同的來源時,企業就會遇到數據集成挑戰。這幾乎是所有企業都面臨的難點,大多數企業是孤立的,這意味著他們可能會為每個業務部門獨立構建數據存儲。問題就出在這,業務部門可能會存儲客戶數據,並且希望識別客戶以進行交叉銷售。合并數據將有助於獲得更好的見解,從而可以節省成本並提高運營效率。但是,當企業想要整合這些數據時,每個倉庫都有自己的數據存儲,並且通常沒有跨單元客戶標識符,這件事情就變得很難了。
所以,我認為難倒企業的倒不見得是物聯網設備增多了,而是企業需要將這些孤立的數據整合在一起。無論是醫療、製造還是金融服務領域,所有這些獨立結構的資料庫都將是一個殺手。
問:您認為應該如何處理隱私問題呢?包括我們的個人隱私以及企業收集的信息中的隱私數據。
Michael Stonebraker:大數據時代,隱私是一個非常好的話題。舉一個簡單的例子,你在醫院完成了一個X光檢查,你希望醫生可以查詢一下,你的X射線與哪些患者比較像,這些患者的診斷說明是什麼,發病率是多少等等信息,這可能就要整合全國的在線醫療資料庫,甚至擴展到多少個國家的資料庫。雖然這對你而言可能是有益的,但這就造成了難以置信的隱私問題。
大體而言,雖然面臨著數據集成方面的挑戰,但技術層面的問題還是可以解決的。但原則上來說,任何一家機構都無權直接或間接披露用戶的隱私數據。
我認為隱私問題本質上是一個法律問題,國家可推出相應的法律法規來規避這一問題可能造成的風險。不幸的是,隱私對社會帶來的價值是可觀的,所以導致很多人屢屢涉險。
問:現在有越來越多的企業會使用預測性數據分析,您認為預測分析還存在哪些問題?我們如何克服這些挑戰?我們談到了隱私方面的問題了,還有其他什麼問題嗎?
Michael Stonebraker:預測模型的問題在於,它們由人類自然構建,因此容易產生偏見。比如特朗普總統大選事件,事後證明很多預測分析模型都沒有做出正確的判斷。
預測分析問題的另一個很好的例子就是學校教師考評,通過對學生的升學之初和學期結束時的成績進行考核,決定教師的教課水平,這就會導致N年級的教師對N+1年級的教師產生影響,這種決策是片面的。
預測模型的問題就是模型本身,我們對模型預測過於信任。如果模型中不包括欺詐,偏見等,還可能會得到一個不錯的答案。
問:安全是關於大數據的熱門話題,大數據在很大程度上對安全提出了新的挑戰?如何修復可能存在的安全問題?安全問題的責任如何劃分?最大的問題是什麼?
Michael Stonebraker:從歷史上看,絕大多數的數據泄露都是從內部開始的。雖然也存在黑客從外部入侵的事件,但有很大一部分是通過內部員工的用戶名和密碼直接登錄內部系統造成的。因此,我認為公司為數據中心安全人員支付更高的薪酬是有必要的,至少可以修復一部分內部人士的數據泄露事件。這不是說沒必要防範遠程攻擊和黑客,只是解決內部問題可能優先順序更高一些。
問:大數據可以如何更好地利用,以提高公眾利益。比如醫療領域的部分數據共享等。
Michael Stonebraker:大數據產生社會效益的例子有很多,無論是提高競爭力,還是大幅改善醫療服務方面,很多例子都與社會福利掛鉤,但需要首先解決的還是隱私問題,如何獲得合理的數據而不破壞個人隱私,這或許是值得探討的。
問:您對大數據的未來還有什麼樣的想法呢?
Michael Stonebraker:我們期望從大數據中獲得的所有效益,都取決於數據無縫集成的程度。解決改進數據集成問題將成為從所有數據中獲益的關鍵。
※暑假大放價 華碩最熱門三款無線路由器
※只需這8步 讓你的雲環境不懼勒索軟體
※智慧城市建設並不難 如何智慧規劃是關鍵
TAG:IT168企業級 |
※繼華為後,內部員工爆料格力也要造電視:董明珠這次會成功嗎?
※OPPO K3還沒開賣就有人曬單了,網友:你是內部員工吧?
※工行內部員工大爆料!揭秘銀行內部晉陞
※PDD刪號逆水寒哭了?內部員工表示:不慌,甚至還有點小高興!
※超市促銷最不能買的3類東西,內部員工:別再犯傻了,賺的是商家
※為什麼Google產品大多都像「半成品」?聽內部員工吐槽它的「鯊魚文化」
※最膨脹電競俱樂部員工?歧視自家隊員,甚至還代表EDG公然辱罵粉絲
※Redhat發布了一個前端框架,結果一個內部員工反水說它不好用……
※內部員工曝光vivo NEX價格,網友看完:這次不跟你們搶小米8了……
※內部員工爆料:全民TV欠薪總額達數億元之多,主播門集體跳槽
※任正非近期清理部分華為內部員工被指營私,他的聲明讓人啞口無言
※內部員工爆料:華為Mate 20或配後置ToF攝像頭
※疑似OPPO內部員工回應抄襲事件,羅永浩是全天下最大地痞流氓
※肯德基點餐「暗語」,以為是內部員工,VIP待遇奉上!
※華為內部員工信:我們·華為人
※魅族炸裂!內部員工再度爆料,確認魅族HALO竟是…
※內部員工爆料:小米MIUI11系統正式開拔
※亞馬遜被爆內部員工賣數據改差評,中國區尤為嚴重!
※高速收費員工資僅2千,為什麼還要干?內部員工:想換都是傻子
※合資車真的那麼強悍?內部員工道出了真相,結果令人瞠目結舌!