阿里大數據分析師之大數據的核心價值
一、大數據的應用
大數據挖掘商業價值的方法主要分為四種:
1.客戶群體細分,然後為每個群體量定製特別的服務。
2.模擬現實環境,發掘新的需求同時提高投資的回報率。
3.加強部門聯繫,提高整條管理鏈條和產業鏈條的效率。
4. 降低服務成本,發現隱藏線索進行產品和服務的創新
大數據的類型大致可分為三類:
1.傳統企業數據(Traditional enterprise data):包括 CRM systems的消費者數據,傳統的ERP數據,庫存數據以及賬目數據等。
2.機器和感測器數據(Machine-generated /sensor data):包括呼叫記錄(Call Detail Records),智能儀錶,工業設備感測器,設備日誌(通常是Digital exhaust),交易數據等。
3.社交數據(Social data):包括用戶行為記錄,反饋數據等。如Twitter,Facebook這樣的社交媒體平台。
二、大數據的定義
1.大數據(Big Data)是指「無法用現有的軟體工具提取、存儲、搜索、共享、分析和處理的海量的、複雜的數據集合。」業界通常用4個V(即Volume、Variety、Value、Velocity)來概括大數據的特徵。
2.數據體量巨大(Volume)。截至目前,人類生產的所有印刷材料的數據量是200PB,而歷史上全人類說過的所有的話的數據量大約是5EB(1EB=210PB)。
3. 數據類型繁多(Variety)。相對於以往便於存儲的以文本為主的結構化數據,非結構化數據越來越多,包括網路日誌、音頻、視頻、圖片、地理位置信息等,這些多類型的數據對數據的處理能力提出了更高要求。
4. 價值密度低(Value)。價值密度的高低與數據總量的大小成反比。如何通過強大的機器演算法更迅速地完成數據的價值「提純」成為目前大數據背景下亟待解決的難題。
處理速度快(Velocity)。大數據區分於傳統數據挖掘的最顯著特徵。根據IDC的「數字宇宙」的報告,預計到2020年,全球數據使用量將達到35.2ZB。
三、大數據的價值
了解了大數據的典型應用,理解了大數據的定義。這時相信在每個人的心中,關於大數據的價值都有了自己的答案。
2010年《Science》上刊登了一篇文章指出,雖然人們的出行的模式有很大不同,但我們大多數人同樣是可以預測的。這意味著我們能夠根據個體之前的行為軌跡預測他或者她未來行蹤的可能性,即93%的人類行為可預測。
而大數定理告訴我們,在試驗不變的條件下,重複試驗多次,隨機事件的頻率近似於它概率。「有規律的隨機事件」在大量重複出現的條件下,往往呈現幾乎必然的統計特性。
隨著計算機的處理能力的日益強大,你能獲得的數據量越大,你能挖掘到的價值就越多。
四、大數據的核心
1. 元數據(Metadata)的概念
簡單說,元數據是對數據本身進行描述的數據,或者說,它不是對象本身,它只描述對象的屬性。
2. 大數據應用的第一階段:輔助產品。
最初的應用比較簡單,就是用以輔助產品人員和市場人員做判斷。
3.大數據應用的第二階段:創造價值
在數據的數量和質量達到一定程度後,事情開始變化了。元數據將不僅作為產品的輔助,而是變成了最有價值的產生本身。
4.大數據應用的第三階段:塑造我們。
我之前也總是對行為數據表示不屑。你知道我在淘寶買了點東西、跟誰微信聊了幾句話、去百度隨便查了點東西,就能知道我是什麼人了?
TAG:程序員OfHome |