當前位置:
首頁 > 最新 > Tableau學習——維度和度量、離散和連續(一)

Tableau學習——維度和度量、離散和連續(一)

GIF/281K

很多Tableau的初學者,經常容易混淆維度和度量、離散和連續各自的定義和關係。下面談一些個人的理解,希望能起到拋磚引玉的作用。

首先要明確一點,維度和度量、離散和連續,是Tableau對數據源欄位分類的兩種方式,也就是說,可以按維度和度量對欄位進行分類,也可以按離散和連續對欄位進行分類。

那麼什麼時候做這個分類呢?當我們添加數據源後,Tableau讀取具體的數據,就會根據數據的特徵進行分類:

按照官方的說法:如果欄位包含分類數據(比如產品名稱、地區、訂單日期),就劃分為維度;如果欄位包含定量數據(比如銷售額、利潤),就劃分為度量。

很繞口,所以我個人理解是這樣,分類數據通常是指文字、日期和無意義的數字,定量數據通常是指有意義的數字。

為什麼這麼說,具體看截圖,維度欄位,數據類型基本都是字元型和日期型,但是有個另類欄位「行ID」,前面的#表示該欄位類型為「數字(整數)」:

但是Tableau認為,該數字僅用於標識每一行,沒有實際意義,因此會將其劃分為維度。

度量欄位,數據類型都是,不論整數還是十進位的小數,並且每個值都是有實際意義,比如銷售額是3.80元,數量是5個,利潤是-0.25元,等等。

接下來,當我們選中一個維度欄位並拖動到行或列功能區的時候,你會發現維度欄位呈藍色,表示離散:

而當我們選擇一個度量欄位並拖動到行或列功能區的時候,你會發現度量欄位呈綠色,表示連續:

這時候的顏色,是另一種分類方式:離散和連續,在起作用。

那麼離散和連續又是如何區分的呢?

首先,離散和連續來源於數學術語,官方的解釋是:離散是指欄位值各自分離且不同;連續是指欄位值構成了一個不間斷的整體。

有沒有一種說了也白說,照樣看不懂的趕腳?所以我的理解是,離散是指欄位值之間沒有什麼直接關係,也無所謂先後順序。比如地區,是先東北,再西北,還是先西北,再東北,無所謂,只要各不相同就行。而連續,是指欄位值在一個區間之間是有連貫性的,先後順序是有意義的,比如銷售額,區間肯定是從0到一個最大值,要麼按從小到大,要麼按從大到小的順序去觀察數據。

有人一定會問,「行ID」呢?它也可以從小到大排列順序呀!我是這麼看的,從關係資料庫角度出發,數據記錄在數據表裡的順序,如果沒有聚集索引,本質上是無序的,「行ID」僅僅起到唯一標識的作用,究竟從1開始,還是從10開始,還是從1000開始,都無所謂,只要在查詢的時候確定有意義的排序就可以了。

更多乾貨

course

Tableau數據分析可視化高手進階

課程介紹

從理論到實踐,從入門到熟練,從基礎到提高,通過這個課程,讓你不再受困於底層數據的處理,而是可以將自己的智慧充分發揮在數據的展示和解說上。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 天善智能 的精彩文章:

如何定義自己需要的序列
人工智慧生態技術架構
五步構建經營指標,拒絕分析不接地氣
思路好,下班早!思路混亂,忙到肝顫!多渠道的分析方法
拒絕雞湯,我要掙錢!用數據分析找到銷售成功背後的真正秘密

TAG:天善智能 |