你知道你的大腦有多愛「.JPG」和「.AVI」嗎
GIF/1.9M
我看見他戴著黑布小帽,穿著黑布大馬褂,深青布棉袍,蹣跚地走到鐵道邊,慢慢探身下去,尚不大難。可是他穿過鐵道,要爬上那邊月台,就不容易了。他用兩手攀著上面,兩腳再向上縮;他肥胖的身子向左微傾,顯出努力的樣子。
朱自清《背影》中的父親很感人。閉上眼,我的腦海里都可以浮現出這個畫面。
這說明:當我們的視覺看到一幅畫面,大腦不僅會思考畫面本身,還會試圖理解背後的意義。
你知道你的大腦有多愛「.JPG」和「.AVI」嗎
——專訪北大可視化專家袁曉如
文|史中
我站在世界的中央,眼睛每時每刻都要接受無數種類的信息,其中可能包括:圖像信息、文字信息、數據信息,等等。
其中,圖像信息在我們認識世界的過程中起了超乎想像的作用。知乎作者陳達曾經舉了個栗子:
我給你報出某個正妹的臉部及身體各部分各器官的精確參數——RGB顏色值啊三維坐標啊長寬高啊之類——讓你擼,你能邊看這些數字邊擼嗎?
答案是否定的,我需要一張圖片,哪怕打著馬賽克。
注意到這個事實之後,我有點不能正視自己了。。。我回想起自己看到「.JPG」和「.AVI」的時候,內心荷爾蒙不可抑制地噴涌而出的感覺。我很想知道,為什麼我們對圖像有這麼強的感覺呢?
於是我找到了幾個數據:
目前科學界公認的數據表明,觀看物體時,人能清晰看清視場區域對應的解析度為2169 X 1213。
再算上上下左右比較模糊的區域,人眼解析度是6000 X 4000。
索尼7680×4320超高清晰解析度的18分鐘未經壓縮的超高清視頻大小為3.5TB,換算一下平均每分鐘194GB。按照這個數據量算的話,每分鐘經過人眼的數據量約為140.34GB。也就是說,平均打一個小時的XBOX360,將有8420.4GB的數據被傳導到大腦。這些數據如果刻成藍光光碟,需要337張!
這說明,我們的眼睛帶寬已經超越了這個世界上最好的高清攝像頭。如果把人眼想像成一個高清攝像頭,這個攝像頭的匯流排帶寬為2.339GB/秒,換算為更形象的網卡速率,應該為19161M網卡。
在我的經驗里,打 XBOX 從來沒有讓我的大腦死機。也就是說如此大量的視覺數據,我們的大腦處理起來沒有任何困難;但是,8420G的數據量,哪怕用十進位數據的方式傳給大腦,也是一個天文數字,接收幾行估計就懵X了。
不幸的是,很多人,尤其是科學家、研究者或者企業BOSS、政府領導,每天面對的可能不是各種妹子圖,而正是密密麻麻的數據。
那麼問題來了,怎麼把這些看了想狗帶的數據,「翻譯」成像蒼老師一樣喜聞樂見的圖像呢?
其實,這是一門了不起的科學,名為:可視化。
作為一個「萬能的史中」,我找到了北京大學可視化與可視分析專家,袁曉如老師。他也是中國可視化與可視分析大會 ChinaVis 的發起人。他告訴我,其實「自古以來」人們就在不斷研究這種把數字變成圖像的魔法。
【袁曉如】
可視化的先驅們
看看這兩張圖,是不是挺熟悉。
現在看起來熟悉,但當這兩張圖剛出現的時候,可是驚為天人。因為它們是世界上最早的餅圖和柱狀圖。
發明出他們的人叫做 William Playfair。WIKI 百科上面說,他曾當過:造水車木匠、工程師、繪圖員、會計、發明家、銀匠、商人、投資經紀人、經濟學家、統計學家、小冊子作者、翻譯家、出版人、投機者、罪犯、銀行家、熱心的保皇黨人、編輯、敲詐者、記者。
目測他的簡歷可能比字典都厚。就是這個人,發明了統計製圖法,這應該是歷史上最早的可視化操作。
不久之後,世界上又出了一位可視化先驅:南丁格爾。
沒錯,就是那個著名的護士。
在克里米亞戰爭期間,南丁格爾通過搜集數據,發現很多死亡原因並非是「戰死沙場」,而是因為在戰場外感染了疾病,或是在戰場上受傷,卻沒有得到適當的護理而致死。為了解釋這個原因,並降低英國士兵的死亡率,她繪製了這個著名的圖表。
【南丁格爾繪製的傷員死亡率圖】
1858年,這張圖表被彙報到了維多利亞女王手中。40歲的女王不需要特別學習,一眼就看懂了南丁格爾想說什麼。一個切角是一個月,其中面積最大的藍色塊,代表著因為本可預防的疾病而死去的戰士數量。
說到可視化,還有一張最著名的圖表:
【拿破崙行軍圖】
它被稱為《拿破崙行軍圖》。這張圖表描繪了拿破崙的軍隊自離開波蘭-俄羅斯邊界後,軍力損失的狀況。在一張圖中,通過兩個維度,呈現了六種資料:拿破崙軍隊的人數、行軍距離、溫度、經緯度、移動方向、以及時間和地域的關係。
以上這些,是在「前計算機時代」流行的可視化圖表。
而在計算機時代,可視化可以做到的事情就更多了。
北大畢業的袁曉如,在美國明尼蘇達大學讀取了博士,從2001年就開始研究可視化。它所代表的一批科學家,是中國可視化研究的創建者。
他把可視化分為三個主要方向:
科學可視化、信息可視化和可視分析
科學可視化
比如下面這張圖:
【三維體數據】
這就是在上世紀末袁曉如帶領團隊所做的科學可視化項目。
顯然,這個系統描繪了人的手部骨骼,他的數據來源是CT。簡單來說,就是把掃描到的一片片數據堆疊成為一個體,也就是:三維體數據。
這樣的工作聽起來簡單:把這些 CT 疊在一起不就行了嗎?
袁曉如說,並不能這樣理解——如果只是對應一套 CT 數據,那麼就失去了科研的意義。他們創造的是一個「傳遞函數」系統,要保證任何一套 CT 數據都可以通過演算法,實時生成一個三維圖像,還要保證根據不同的骨骼密度和血管性質,用顏色明確地區分出來。這涉及到一個複雜的實時計算模型。
隨著科學家們不斷解鎖新的姿勢,科學可視化也可以展現更複雜的世界。
比如下面這個:
這張圖展示了颱風各個部位的氣流特徵,很多組參數被同時展示在了「平行坐標」中。通過這個可視化模型,科學家尋找到影響颱風總體性質的關鍵節點,在圖中標註出來。
講真,氣象一直是最消耗資源的一項研究。不同的科學家都提出過不同的數學模型來計算某個氣旋的「走位」。但是根據不同模型計算出來的結果,到底差異在哪裡,差異又有多大呢?面對一堆數字,科學家們也沒有很好的辦法進行比對。
沒錯,又該輪到可視化工具出場了。袁曉如和團隊做了一套可視化系統,可以根據不同的模擬方法,繪製出某個氣旋不同的走向,然後集合在同一張圖中。
在這張圖裡,所有的計算模型計算出的結果一目了然。在下面的圖表中,反映了不同計算方法隨著時間的推移,擬合程度也在發生變化。
說了這麼多,感覺可視化的技術似乎只有高級的科學家才能用到,作為幼兒園畢業之後就放棄科學家夢想的我來說,好像遭到了赤裸裸的鄙視。
袁曉如說,其實真相併不是這樣。科學可視化其實只是可視化技術的一部分。在很多更加普及的領域,信息可視化會發揮很大的作用。
信息可視化
舉個栗子,北上廣深的童鞋們喜聞樂見的自然現象:堵車。
交通部門可以採集不同路段的交通數據,然後通過可視化的方法把這些信息呈現在地圖上。
這樣,隨著時間的推移,擁堵點的變化就非常明確地展現在地圖上。具體到最堵的地點,如果有足夠的數據,可視化系統又可以展現出在細節上擁堵究竟是如何發生的。當擁堵再現於屏幕,我們就像俯瞰生靈的上帝。
比如這張圖:
點H最早發生擁堵,然後迅速傳導到I和J,隨後點D擁堵,傳導到了G和E,最終E點在雙重壓力下,堵車非常嚴重。
這是最典型的信息可視化,普通人也可以從有趣的圖形中得出自己的結論。
然而,交通擁堵的問題之複雜,可視化系統也許無法解決。不過說到底,解決問題的第一步,還是應該知道問題出在哪裡。
我們每天一睜眼就扎進忙忙的人海里,對於城市來說,無時無刻不沸騰著各種大數據。
信息可視化,正是讓你「看見」大數據的一個方法。
比如這個:
針對偽基站活動範圍的可視化系統。
一般來說,有一種人叫做背包客,他會背著一套高功率的簡訊發射系統,沿著大街小巷遊盪。向無辜群眾發送詐騙簡訊。
這些詐騙簡訊的數據來源於用戶向360的舉報。根據不同時間段用戶的舉報,結合用戶在收到詐騙信息之前的位置,就可以定位出偽基站背包客的運行軌跡。
可視分析
當然,對於普通人來說,可視化還有更多有趣的玩法。例如你不滿足於僅僅看到數據呈現在眼前,你想知道這個世界上正在發生什麼。
例如,一個微博是怎樣傳播的。
【微博地圖,顯示微博主題之間的關聯】
從這個圖裡,可以看到一個微博究竟是怎樣從一個點開始爆發,究竟被哪些人轉發,轉發的深度和層級如何。
另外,袁曉如還帶領團隊開發了一種大家喜聞樂見的「玩法」:根據豆瓣電影上的關係鏈來搜尋你可能感興趣的電影。
例如搜索《X戰警》,就會出現相關的電影,你繼續選擇喜歡的電影,還會出現更多風格類似的電影。
【從《X戰警》引發出的關聯電影】
(如果你也想試試,可以留言索要網址)
總之,可視分析的意思是,從某種特定的數據結構里,根據你的需要,提取出你需要的數據維度。
「挑食」的大腦
袁曉如老師說,無論是科學可視化、信息可視化還是可視分析,從根本上來說,都是把數據映射成圖像的工具,最終目的只有一個:藉助我們的大腦,來歸納得出未知的規律。
數據—圖像—大腦—規律
我們發明了計算機,甚至製造了人工智慧,但機器更擅長在已有的規律下處理事物,而人擅長的是結合背景知識,在信息量很小的情況下發現規律。
有一件事讓我覺得有趣又傷感:
面對無數堡壘後面隱藏的世界的真相,我們最可依賴的武器還只有大腦。
而這個大腦,卻有點「挑食」。
從生物進化的角度來說,我們的大腦只是人類的生存機器。周遭環境發生了微小的變化,都會引起我們的警覺,而一旦加入稍微複雜的邏輯判斷和數據運算,我們就要死機。
為了讓我們的大腦有更舒服的姿勢探索世界,科學大牛們只好把數據變成可視化圖像。但是,由於對人腦的運作機制知之甚少,所以可視化大牛們只能靠「手感」來設計映射方式,然後再在實際應用中驗證這些方法的優劣。
至於怎樣才能精準地設計出讓人類一看就雙眼放光的可視化系統,袁曉如老師說,別急,也許只能等腦科學和認知科學進一步發展。。。
GIF/389K
【可視化系統中,成都地鐵人流量在中午時分的變化】
在現有的技術條件下,做出讓普通人能夠有感覺的可視化系統並不是沒有可能,而是難度更高。
袁曉如本人雖然是一個學霸,但他卻一直致力於構建一套廣泛適用的「可視化系統生成理論」,讓不同知識背景的人都能方便地從可視化系統里創造價值。
於是,他要解決一個巨大的問題——速度。
一個可視化系統在「數據-圖像映射」方面做得越透徹,作為工具就越好用。但是相應地,耗時也會非常長。
他舉了一個例子,在某些軍事場合,或者抗震救災、搶救危急病人的場景,需要立刻馬上進行數據分析,刻不容緩。在這種情況下,如果靠科學家們手工打磨一套可視化系統,等送到前線的時候,可能黃花菜都涼了。
時間不等人,這種情況下,必須有簡單靈活的方式快速構建一個可視化系統,也許不是那麼精巧,但是卻可以大大提高人決策的效率。
GIF/479K
結語
「勾股定理」,也許是這個世界上最古老的謎語之一。
純數學的方法,普通人終其一生也未必可以理解,但是只要在三邊之外加上輔助線,用幾何的方式來觀察,很多人就會恍然大悟,得證涅槃。
讓無數數學家成為折翼天使的「費馬大定理」,同樣是在「谷山-志村猜想」下,把其中的一段證明變換成與幾何相關的橢圓曲線,才得以證明。此時距離費馬大定理提出已經過去了300多年。
而就在最近幾十年,藉助可視化系統,人們已經在核能和軍事方面取得了重大的突破。直到訪談結束,我才意識到這些絢爛的圖形背後,牽動著物理世界的每一根神經。
面對世界,我們幾乎一無所知。我們甚至對自己創造出的人工智慧神經網路的具體工作流程都不清楚。
可視化技術同樣可以探查我們親手製造的人工智慧。
袁曉如說:
縱然機器學習可以解決很多問題,但是大多都是輸入數據,輸出結果。中間的運作過程是黑盒子。其實,我們面對的所有未知,都可以說是一個黑盒子。而作為人,我們恰好天生就想知道所有黑盒子里的秘密。有一句話,叫做:open the black box。打開黑盒子。
說到這裡他笑了。
我想,這或許就是可視化技術的動人之處。
註:本文部分圖片來自北京大學可視化與可視分析研究組。
另外,袁曉如會在2017年9月12日舉行的ISC中國互聯網安全大會上,分享他的最新研究。在這裡做個廣告,歡迎大家關注~~
※一個叫「鬧心均」的人搞了個亂來的黑客沙龍,他會被360開除嗎?
※我把賴床懟死了,兇器是一個叫「睡你妹」的免費軟體
TAG:淺黑科技 |