《可視化未來》書評一:科學和人文為何能搞到一起?因為大數據
(李驥 狐狸獵手)
我現在希望兒子會問我這樣的問題:"Daddy, 為什麼drive的過去式是drove,而不是drived呢?"
因為如果他問我這樣的問題,我就可以用剛讀過的《可視化未來》來跟他臭屁一下不規則動詞的前世今生和未來了。
如果可能的話,還可以臭屁一下這個他一定會很懵圈的概念:大數據。
大數據:新的透鏡
實際上我們見過很多熱衷於談論「大數據」的人,我相信其中大多數對於他們津津樂道的東西,其實也一樣懵圈。
我本人對「大數據」同樣也是懵圈的。之所以只能浮潦草知道個概念而無法難深入,其實心底里有一個頑固的想法:
大數據,是那些理工男的事。
直到讀到這本書的副標題「數據透鏡下的人文大趨勢」,才發現原來文理之間並非那麼涇渭分明。
這本書在收尾時說:「科學和人文再次志趣相投地走到了一起。一如伽利略在17世紀深刻地影響了我們認識世界的方式那樣,科學和人文這兩個背靠著的透境正在21世紀作出同樣的壯舉。」
科學和人文為何能走到一起?因為大數據。
具體說是因為本書作者們組成的研究小組,通過對谷歌圖書海量資料庫的詞頻分析,揭示出很多人文思想的興衰沉浮,因此洞見人類文化與歷史的某種趨勢。
作者將「大數據」比喻成為重新檢視人文歷史的「透鏡」,這個比喻來自伽利略。17世紀的伽利略用兩塊背靠著的光學透鏡製成的望遠鏡,發現金星在幾個月內正遠離地球。由此推演出地球圍繞太陽運動的假說,並由此掀起一場科學甚至人文的革命。
而伽利略當時使用的望遠鏡,其實只比肉眼看到的東西大30倍而已。
一個小小的發明就這樣掀起一場人類認知和思想的革命。而今天,大數據已不再是這樣一個小小的發明而已。大數據的力量的巨大的,它能改變人類看待自身和世界的方式,因此能改變世界和未來。
但前提是你需要有一個正確的方法。
BIG DATA: HOW IT WORKS? - 大數據如何運作?
要讓大數據work,必須有一些對數據抱有執念的痴迷的人。本書作者這幾個人大概就是這樣的人。---他們和谷歌的創始人一樣,希望量化一切。
實際上他們也真的與谷歌走到了一起。這本書的立論建立在一個核心方法論上,作者稱之為「N元片語」(N-gram),意即具一定文化意味的詞或片語單元。利用谷歌圖書的海量數據,N元片語分析軟體能計算出某一特定詞或片語在人類已出版的圖書中所出現的頻次(詞頻),來該辨別該片語所代表的文化概念在某一特定時間段的流行程度。
通過檢測一個歷史階段內詞頻的變化,就能推斷出一定思想意識和文化概念的興盛和衰落。
這一大數據分析模型所使用的「谷歌圖書」,當時已對3000萬本圖書進行了數字化,約佔人類出版圖書總量的20%。分析模型使用部份數據,也覆蓋了人類有史以來出版圖書的6%。這是真正的「大數據」。
谷歌的雄心在於數字化全、部、的、人類出版過的圖書,其數據可追溯到數個世紀之前,因此上述的詞頻分析所使用的數據,不僅是「大數據」,更是「長數據」。
所以「詞頻」分析僅僅只是一個工具和原理,真正的價值還是產生於谷歌所創造和積累的既「大」且「長」的數據本身。
【讀到這兒很累吧?歇一下再讀下篇 --- 《可視化未來》書評二】
TAG:狐狸獵手 |
※關於「體檢報告」,這大概是最科學的一篇文章了!
※科學揭秘:為什麼螞蟻看不到人類?因為它是二維視覺的生物
※為什麼要讀科普?如何讀?我們諮詢了一圈知乎上的科學博士
※一篇文章告訴你如何成為數據科學家
※不明生物清晰可見,這樣一組照片科學能解釋嗎?
※為何總是喜歡同一類男生?原來心目中的理想型是有科學根據的!
※看完這篇文章,你就明白以貌取人是很科學的!
※《聖經》為什麼讓無數的總統、科學家、名人折服,他到底是一本什麼樣的書?
※為何你是世界上獨一無二的?科學發現驚人秘密
※男子錄下了一隻不可思議的章魚,連科學家都驚訝了!
※5大經典「流言」,看科學家如何一一擊碎
※沒想到一片葉子,都能插出一盆綠蘿!太不科學了
※如何評價曹則賢的科普文《天大的誤解:物理學是一門實驗的科學》?
※G?知 總喜歡同一類男生?原來心中的理想型是有科學根據的!
※科學糖精第一人:要不是作死的成果,人類都享受不到
※仙人掌能防輻射 其實這種認知是沒有科學依據的,一起來看看吧
※看似簡單問題卻是科學家的難題,一直都說不清為什麼
※科學的未來是藝術?
※《十字》:科學怎麼越來越讓人不放心呢?