當前位置:
首頁 > 最新 > 什麼是大數據?

什麼是大數據?

本來之前定好的內容已經寫好了大半,但是源於近日的一些感悟,臨時決定還是寫一下到底什麼是大數據、什麼是數據分析師能做的。不當之處,望留言指正。

什麼是大數據?

這是一個新興的概念么?說是就是,說不是就不是。其實數據一直存在,只是需要感謝這個蓬勃發展的信息時代,使得獲取並分析這些數據成為可能。於是大數據概念順勢而出。

可以簡單理解,每一條行為就是一條數據。去車站買票、去銀行存款、拿起電話發個簡訊等等等等。只是人們的日常生活越來越依賴於數字化的信息網路,所以使得行為軌跡較歷史而言更加的聚集。當人們都拿著現金去市場買菜的時候,除了人工去計算誰知道交易額是多少?哪怕是攤主本人,也要數數才知道。此時的數據獲取是十分昂貴而低效的。但是當在線交易已經普及到方方面面的時候,只需要打開手機就能快速統計到交易額,甚至看到每一筆往來記錄。那麼,也可以簡單的推想,信息網路上到底有多麼龐大的數據量。

說一句小白的話,大數據技術就是處理大數據的技術。如果數據量沒有達到P級,我認為其實是不需要用到大數據技術的。主流的資料庫軟體已經能夠有很強的可靠性和處理能力,部署相對也簡單很多。大數據技術主要是構建了一種全新的數據處理理念;易於幫助我們去理解的,主要是數據分片和分散式處理;技術的根本是使處理龐大數據成為可能並且盡量的加快處理速度。從使用效果來看,這種能力是已經具備並十分可靠的。比如,現在主流APP都會有推薦功能。同一款APP不同的人打開有不同的主頁,這就是根據單用戶的歷史瀏覽記錄而生成用戶畫像,為用戶推薦類似的內容。

大數據技術的驅動力

在這個時代里,賺錢不易。幾乎每個行業都面臨著激烈的競爭,用戶的忠誠度下降、對服務品質的要求在提升。對於企業而言,所有的問題已經從怎麼吸引用戶變成如何留住用戶。比用戶更懂用戶,提供個性化的服務、挖掘潛在的消費點等等,更好的盈利才是企業致力於加強大數據技術的驅動力。

大數據是不是無所不能?

技術永遠都是手段,是手段就會有局限。大數據技術的邊界在於數據源,而技術質量的邊界在於使用者。

巧婦難為無米之炊。沒有數據的支撐,技術手段都是空。如之前的例子,如果數據源只有交易明細,怎麼用大數據技術來分析我小學同學的二舅是誰?

同時,大家也會有一個明顯的感覺——有的APP比你更懂你,有的卻是「呵呵」?其關鍵就在於誰的演算法更加貼近於用戶的真實畫像。

大數據是怎麼運轉的?

我個人比較傾向於將大數據的整個過程劃分為架構、演算法、分析。

總的來說,最為關鍵的是分析。分析可以是事前分析也可以是事後分析。所謂事前分析更貼近於需求管理,就是將目的轉化為可執行的具體內容。事後分析,更加傾向於策略指導;主要是分析到行為背後的歸類,幫助指引修正策略。演算法是將分析所設定的條件轉化為具體的演算法。簡單舉個例子,我們通過用戶的歷史播放記錄去描述用戶的喜好,然後將全量音樂進行歸類,為用戶推送更為貼近用戶喜好的音樂。那麼演算法就是如何將「用戶播放記錄中輕音樂的次數>500次」。當然,應用級別的演算法那是相當複雜了。

架構是如何更加高效的利用資源。如果不做後端的話,涉及就比較少。能明白表和欄位的關係就好~

今天就先寫到這裡。本人也並非專家,只是希望藉此平台交流經驗、共同提升。未來將在此介紹一些數據可視化分析的一些思路和小技巧。

最後,感謝您的關注。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 數據可視化分析 的精彩文章:

TAG:數據可視化分析 |