誰是數據可視化的最強跨界CP?
DAY 4 7月15日
時磊
中國科學院
>>>網路數據可視化
時磊教授首先分析了傳統意義上的網路結構數據和新型信息網路之間的不同點。接下來詳細講解網路數據的基本概念。
網路數據基本概念
社會網路數據包括節點和邊,通過圖布局將社會網路數據進行可視化。
節點:信息實體
邊:關聯關係(好友關係、評論關係、轉發關係,)
圖布局:圖繪製、圖交互
圖布局質量判定規則
首要規則:最小化(邊交叉數目),更多的邊交叉導致用戶可視化理解圖數據能力顯著下降。
次要規則:最小化(邊曲折度),更多的曲折邊導致用戶可視化理解圖數據能力一定程度下降,尤其當曲折邊非常多時。
圖布局演算法歷程
1、手動圖布局,~1950s
2、Tutte基於重心的自動演算法,1963
3、基於Planarity的精確布局演算法,1980s
4、基於力導向的啟發式布局演算法,1980~
其他定製化圖布局方法:層次圖布局、正交圖布局。
網路可視化總結
需求包含以下三個方面:
1、網路數據蘊含世間萬物相聯、相生、相剋的複雜關係。
2、網路(圖)數據是大數據的核心之一。
3、在大數據時代,網路數據正走向大型化、動態化、多樣化。
主流網路可視化方法:
1、中小型網路:基於力導向的圖布局演算法,其他針對特殊需求定製的網路布局(層次、正交、輻射狀等)。
2、大型網路:基於網路數據變換、壓縮、抽樣的綜合可視化方法以及基於近似演算法的圖布局。
講座的最後,時磊教授講解了影響力圖譜可視化,分別從什麼是影響力圖譜可視化、為什麼分析影響力圖譜、以及怎麼進行影響力圖譜可視化三個方面來進行講解。
周志光
浙江財經大學
>>>地理信息可視化
地理空間數據是指具有嚴格地理空間意義的對象描述,以及在物理空間中人類活動產生的人文數據。來自浙江財經大學的周志光教授為我們介紹了地理空間數據可視化。
地理空間數據可視化
地理空間數據可視化主要包括地圖投影和數據可視化兩方面。地圖投影是要將三維的地球投影為二維的地圖,大致分為三種方法:等角度,投影前後的任何位置的局部切向和法向方向組成的角度保持不變;等面積,投影前後的相應圖形面積大小保持不變;等距離,投影前後的各個位置在標準經緯線的長度保持不變。
在此基礎上,我們可以在地圖上根據地理空間數據類型使用點、線、區域和立體可視化元素。根據地理空間數據的不同屬性,可以採用空間多維,空間時序,空間層次和空間稀疏等可視化方法。
可視化案例
最後周志光教授用城市交通,自然環境和經濟貿易的可視化案例介紹了地理空間可視化的應用。
馬昱欣
浙江大學
>>>數據挖掘釋義
來自浙江大學可視分析小組的博士生馬昱欣分享了有關數據挖掘基礎,以及數據挖掘與可視化在數據分析上交叉結合的內容。
數據挖掘通常被定義為「一種自動、簡易地從數據中提取表示知識的模式的過程」,在文本分析、檢索、社交網路分析等領域有著廣泛的應用。從任務分類上講,數據挖掘主要面向描述性任務和預測性任務。描述性任務用於說明已有數據中包含的模式和知識,而預測性任務首先基於已有數據得到一個用於預測的模型,進而對新數據的模式和趨勢進行預測。
可視化與數據挖掘作為數據分析和知識發現的兩種思路,兩者之間有著密不可分的關係。可視化可以幫助數據挖掘研究者和用戶更好地理解輸入數據,窺探模型機理,以及查看得出的模式。反之,數據挖掘可幫助解決可視化方法中某些環節的問題,例如高維數據投影、圖結構中的聚類等。
近年來,可視分析學科發展迅猛,其核心內容就是面向分析任務,如何有機地結合可視化和數據挖掘,使兩者相輔相成,以輔助人的探索、尋證、推理、決策等分析工作。預測性可視分析是可視分析學科的新興方向之一,其利用預測性數據挖掘方法的強大預測能力,結合可視化來展示對目標對象未來發展的趨勢。該方向在今後一段時間內仍將得到大力的發展。
王瓊
武漢大學
>>>數據新聞與數據可視化
在大數據時代,數據極大豐富,媒體更加重視將此作為重要的生產資料。近來,國內外的媒體都逐步引入了數據新聞。
講者通過幾個實例對數據新聞的概念做了進一步的描述,並對比了它與計算機輔助新聞等常見概念的區別。概括地說,數據新聞的本質是基於數據科學的知識和技術,通過或結合數據分析對新聞時事所做的報道。當前,數據新聞的呈現形式十分多樣,從傳統的圖文到視頻、音頻等多媒體手段,都可以用在這個領域。不過,國內目前的產品形態仍然以靜態信息圖或圖文為主。
接下來的展示包含了一些交互可視化的案例,內容覆蓋了各種主題,如時政、經濟、教育、娛樂等等,通過這些例子表現了數據新聞在敘事上的特點:對數據有量化、結構化的要求;數據的選擇會體現明確的內容(而非僅僅堆砌);與傳統的表達形式相包容;給用戶提供更大的閱讀自主性(交互)等。
下一部分的內容是關於數據新聞可視化的幾個迷思。比如如何看待數據新聞與數據可視化的關係、數據新聞與大數據新聞的關係等。
最後,講者介紹了武漢大學的「鏑次元」數據新聞研究中心,以及它的媒體平台、品牌活動、培訓、研究,和一些數據新聞案例。
姜忠鼎
復旦大學
>>>AR+VR+VIS
姜忠鼎教授首先通過展示一些VR、AR相關的產品和影視作品來解釋VR、AR、MR這三個概念。
VR、AR、MR這三個概念
VR虛擬現實是將多種物理感測器設備與計算機相連,利用計算機強大的處理能力,生成高度逼真、可以實時交互的三維虛擬世界。通過對人類視覺、聽覺、觸覺等多種感受的模擬,給用戶提供身臨其境感受。
AR增強現實是一種實時地計算攝影機位置和朝向以及真實世界的三維模型,在屏幕上將虛擬信息疊加在現實世界上,並進行互動。
MR 混合現實技術是虛擬現實技術的進一步發展,該技術通過在虛擬環境中引入現實場景信息,在虛擬世界、現實世界和用戶之間搭起一個交互反饋的信息迴路,以增強用戶體驗的真實感。
沉浸式可視化與可視分析
沉浸式可視化與可視分析的目的是讓數據分析師進入大數據內部,為數據分析師提供更自然直觀的數據探索,分析和協同工作方法,豐富體驗激發構想力獲得對數據更全面理解和更深刻的洞察力。
沉浸式可視分析系統
姜忠鼎教授通過對一系列視頻介紹了目前已有的沉浸式可視分析系統。包括傳統沉浸式系統的典型工作(如CAVE、CAVE2、RealityDeck、SAGE2、CyberCANOE等),VR/AR頭盔的可視分析系統(在體數據、傳統數據、圖數據、關係數據等數據可視化中的應用),以及集成VR/AR/MR的沉浸式可視分析系統。
需要解決的科學問題與核心技術
在報告的最後,姜忠鼎教授總結了研究沉浸式可視分析需要解決的科學問題與核心技術。信息可視化如何從2D升級為3D、2D與3D信息如何混合、如何選取一個好的觀察模式、同步/非同步、本地/遠程、定性評估和定量評估等。
郭方舟
浙江大學
>>>層次數據可視化
層次數據是一類表現個體之間層次關係的數據,比如,社會關係中的從屬關係,文件列表,物種演化等等。對層次數據的可視化方法一般可以分成三大類,節點鏈接法、空間填充法和混合型方法。
節點鏈接法
利用節點鏈接法對層次數據進行可視化,就是利用節點來表示層次數據中的實體,利用鏈接來表示實體間的層次關係。根據布局方式的不同,可以分為正交布局(包括電路圖、縮進圖、聚類樹等等),徑向布局和自由布局。
正交布局
正交布局包括電路圖,縮進圖,聚類樹等方法,下圖就是一個聚類樹的例子。節點沿著y軸排布,而表示層次結構的鏈接則都是正交的。
徑向布局
徑向布局是將層次數據中的節點沿著數層同心圓進行排布,如下圖所示,所有的葉節點沿著一個圓環進行布局,而其他的非葉子節點則按照距離葉節點的距離排布在相應的圓環上。
空間填充法主要就是樹圖,這種方法按照層次結構對空間進行剖分,父節點的大小有子節點的大小決定。
混合型方法
混合型方法則綜合了節點鏈接法和空間填充法,如下圖所示,當某一層的節點數過多時,就可以選擇使用空間填充法進行局部的可視化。
論壇記錄員
朱閩峰、劉良軍、林立文
暑期學校結束
小編這幾天的學習感受
如圖
明年暑期學校再見
╭(`?′)╯╰(』』)╮
寬視 · 善知
寬視以博物 · 善知以致知
TAG:寬視善知 |
※數據差異的可視化
※大數據時代下的BIM數據可視化
※你說,數據可視化哪家強?
※可視化數據中的不確定性
※中了數據可視化的毒:BBC如何使用R語言繪製數據圖表?
※冬奧會中的數據可視化
※數據可視化,難點在哪兒?
※互聯網項目中針對數據分析和數據可視化實現的重要意義
※通過Python數據可視化,了解絕地求生遊戲中的秘密
※數可視黃志敏:數據可視化領域能否誕生「獨角獸」?
※VR可視化工具Lume可讓複雜數據直觀易懂
※如何輕鬆實現數據可視化?
※程序員,你真的懂數據可視化嗎?
※4種更快更簡單實現Python數據可視化的方法
※Python 數據可視化利器
※Python如何實現數據可視化?
※數據降維與可視化
※話說安全數據可視化
※視覺可視化,就是做餅狀圖柱狀圖?No!別因為「數據」誤會它!
※據說這是史上最牛逼的可視化神器