當前位置:
首頁 > 最新 > 可視化數據中的不確定性

可視化數據中的不確定性

數據是真實生活的象徵。這是抽象的,而且不可能封裝一切在電子表格中,導致數字的不確定性。

一個樣本代表了一個完整的人口是多少?數據集代表真理有多大可能?你相信這些數字多少錢?

統計是一個遊戲,你可以計算出這些不確定性並根據你的計算做出估計判斷。但是標準錯誤、置信區間和數據集往往會丟失數據圖形中的視覺空間,從而導致基於簡單摘要的判斷,即指、中值或極端。

那可不是好事。你錯過了有趣的事情重要的東西。因此這裡有一些可視化選項,用於數據中的不確定性,每一個都有其優缺點和示例。

首先,我們首先從傳統的可視化方法入手,這至少是顯示一個範圍或置信區間。中間點表示平均值或中值,而條形或線條顯示其他可能的值或覆蓋範圍。

優點

行或欄表示值範圍,因此您可以看到平均值或中值僅表示估計數的一部分。當比較多個估計數時,該範圍特別有用,因為您可以看到類別之間的重疊。你從根本上得不到這個。

缺點

如果您有完整的值分布,則不會看到數據中的所有細節。此外,很多人都不理解置信區間的概念或者標準錯誤欄是什麼,所以您需要用注釋來清楚地解釋。

實例

FiveThirtyEight通常在評估工作中的不確定性方面做得很好。在他們的籃球運動員的評分和預測它們顯示了一個黑點後面的輕灰色桿,代表可能的玩家隨著時間的影響。

另見:經典盒形和-圖|||按行業分列的薪金我的嘗試動畫潛在價值當然,你怎麼能忘記抖動量規.。

顯示可能值的擴展直方圖或a變異的你可能會看到一個中間位置永遠不會顯示的東西。

優點

通過顯示樣本中的變化,您或讀者可以對樣本是否可信作出更多的教育判斷。奇怪的扭曲嗎?有多重峰值嗎?還是它是一個預期的鐘曲線?

缺點

再次,很多人不理解發行版,所以你需要解釋一下發生了什麼。有時變化只是噪音,或者細節可能掩蓋森林為樹木。

實例

當人們在他們的關係中經歷了第一次時,就會有很多差異,而不是僅僅是平均年齡,我使用了發行版.。

另見:人們如何度過時光用平行坐標可視化。

當談到預測和預測時,可以看到各種結果來看看會發生什麼。關鍵詞:可能.。

優點

不確定性顯示得更加明確。人們可以看到沒有設置路徑,而是看到了一系列可能的路徑。

缺點

如果噪音太大或者太多的可能性,圖表可能不會提供任何用途。但這可能是預測比圖表選擇更重要的問題。

實例

為了顯示選舉的模擬不確定性,在顯示多個委託結果同時使用各種模型。

另見:颶風追蹤以及風扇圖對於時間序列數據,以及bootstrap密度曲線.。

類似於顯示多個結果,看到各種結果逐個地生成一個整體圖,從而為預測的模糊性提供直觀。

優點

當數據出現在同一次或聚合時,對於許多人來說,解釋結果並將其鏈接回實際表示的數據是一個挑戰。通過展示模擬,你會得到一個建立起來的感覺和一個與個人結果的聯繫。

缺點

過多的重量可能會被放在個人結果上,從而掩蓋了整個畫面。

實例

社會保障管理局規定了預期壽命和死亡概率。我用它來模擬你可能已經離開了多少年.。

另見:你怎麼會死|||1000美國人之日還有多邊形的寓言.。

估計越不確定,越難看到,與更多的估計相比,視覺上的突出程度就越低。您可以通過一些方法實現此效果,例如透明、顏色大小或非透明。

優點

隱喻是有道理的。如果你對估計值不太確定,那麼它就會使它看起來更不突出。因此,空氣中較少的數據會引起更多的關注。

缺點

模糊或模糊如何感知?不同層次實際上是解釋還是是二元性的東西?這需要更多的研究。

實例

我還沒見過這麼多事情,但是風預報圖由莫里茨·Stefaner想到了。

線條代表風的預測,而不透明度代表著預測的力量。


也許可視化並不是你想要的。畢竟,你不必觀想一切通過避免在描述數字時避免絕對,您可以將不確定性添加到您的寫作中。當你使用這些估計時,就會考慮估計數,並考慮到數字中的不確定性。

GIF


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 大數據周刊 的精彩文章:

數字設計的未來:AI在UX設計中的作用!

TAG:大數據周刊 |