當前位置:
首頁 > 最新 > 數據分析:一個有千年歷史的行為為什麼現在這麼火

數據分析:一個有千年歷史的行為為什麼現在這麼火

寫這篇文章源於近期我對很多企業在招聘數據分析人員時JD中描述的一些困惑。作為一個產品經理也對數據分析和大數據有這麼一點點的理解。作為正式開始專業討論的第一篇文章我先簡單介紹一下我寄幾。我是一個擁有二十多年網齡的老網民(今年只有30歲),家庭因素有幸在國內大多數人還沒有接觸過計算機時已經深感到網路的神奇。在淘寶還沒有街知巷聞的時候已經通過噹噹、卓越這些站點的合作代碼建立了自己的在線銷售網站,遺憾的是並沒有因此發家致富(此處應有一種悲涼的微笑)。商科畢業的我一直在中小企業中遊走,畢竟學渣想進大企業沒點關係是有很大難度的。當然這也給了我一些機遇可以快速超越一般的PM獲取豐富的經驗。我獨立負責過網站,APP,後台,消費電子類智能設備,2C,2B的各種項目,我了解Google和百度SEO輕鬆可以將企業關鍵詞在短期內(一般大約一個月內)做到首頁。我負責過新媒體推廣和相關策劃。可以說這些都是小企業相比較大企業給我帶來的優勢。很多大企業HR在面試看簡歷時都會比較強調某項技能的時候他們不能理解一個小企業的人想要在3年內做到總監的位置能協助管理公司就要在技能上面面俱到。我並非全能,但開篇的牛B要先吹足不是(嘿嘿)。

廢話說的有點多,當然不服的人還是會嗤之以鼻,您就當看個樂,用輕鬆的心情去看專業的討論可能會更舒服一些。既然我們聊數據就要先確定一下數據的定義。很遺憾我身邊沒有辭海,作為互聯網人可能更習慣借鑒百度百科。在百度對數據的定義數據(漢語詞語):數據就是數值,也就是我們通過觀察、實驗或計算得出的結果。數據有很多種,最簡單的就是數字。數據也可以是文字、圖像、聲音等。數據可以用於科學研究、設計、查證等。所以我們可以理解為所有能獲取的信息包括動作都可以被稱之為數據。一個數據分析人員如果不能清晰的了解數據的定義那麼也不存在可以有效分析數據的技能。各位看客不要笑,尤其是那些已經從事數據分析工作的產品和數據專家們。你們在做分析時一定會忽略以上這分類中的某幾點從而造成工作這麼多年都沒有將數據分析明白。

讀到這裡我承認我是來挑事的,為啥我那麼大膽?因為這個公眾號目前沒那麼多人關注,那些數據相關從業人員面對上面提到的這些不願承認的事實也不會大面積轉發。當然最關鍵的就是下面會提到的案例中狠狠的戳中了這些數據從業人員失敗的痛點。

大數據是近幾年來的一個熱門,養活了好多企業也養活了好多數據從業人員。在人人高談闊論大數據的時候,我們可以簡單點就是數據夠大夠多,我們就叫它大數據了。至於能不能用,怎麼用我們先不管,只要它大就好。聽著是不是…有點污?沒事習慣一下就好。大數據能給我們帶來的當然是更全面的數據分析維度,更精準的數據分析結果。但是同樣也會是讓數據分析這項工作增加了更多的難度,如何組合數據,如何判斷組合的正確性成為了一個隱含的問題而且這個問題並不好被證實。

好了剛才第一輪鄙視過的那些數據從業人員,現在要開始插刀了。數據衍生這個詞應該很少有人提及,沒關係這個詞是我造的,百度里並沒有官方解釋,不過別著急看完下面的案例你就會明白為什麼會有這個詞。在一些面試中我曾經有提到過目前BAT的數據分析存在的一些問題。當然有些面試官表示認同有些則不太理解,仁者見仁嘛。下面給到一個日常生活的案例。首先數據衍生並不是真正意義上的數據分析,只會淺層的數據解釋而已。舉個例子,某寶某東大家應該用的應該不少這兩家在數據處理上也算是國內比較大的互聯網企業了輪專業性和團隊都是首屈一指的。但是我們都有發現一個明顯問題當我們在某寶購買一個商品或者瀏覽過某一商品時再次刷新頁面後特別推薦就會瘋狂的推薦相關同類商品。那麼問題就出現了,當我購買了一包咖啡時系統自動為我推薦更多咖啡原因是我可能是個喜歡喝咖啡的人,這類推薦有可能增加我的再次消費。那麼如果我購買了一台彩電呢?毋庸置疑係統會繼續給我推薦彩電。它可能認為我家比較大每個卧室都需要一個彩電,但是很遺憾我名下連房都沒有。這種推送方式就叫做數據衍生,這個詞是我用來嘲諷那些數據分析人員和產品用的,因為這種推送根本用不到數據分析這麼有專業性的辭彙去解釋,百度你也別笑,你的新聞推送也存在同樣的問題,這就是為什麼前不久GOOGLE和FB都爆出竊取用戶語音信息的事情,因為點擊和文字確實對這些技術出身的分析人員有很大難度。數據衍生不好么?為什麼有些問題卻還在被應用?因為數據衍生是最簡單最直接的方法,就像我剛才提到的有些商品重複購買率高,那麼這種數據衍生方法在這類情況下會給運營人員一種錯覺「這個分析方法是對的,它確實讓銷售數據增長了」。這就像我們用怪物去打怪物,怪物救了我們但他依舊是怪物,並不能因此去掉他也吃人的本質。那麼如何讓數據衍生升級成為數據分析呢?另一個案例說明了問題,作者本人曾經在海外讀書,經常會使用亞馬遜進行網購。亞馬遜在場景的應用中做出一個很小的設置當我購買咖啡的時候會在支付區域有一個定期購買的選項,若勾選則每月按時劃款並郵寄商品給我。但是對於客單(不明白這個詞的請自行學習電商專業辭彙)高的商品如大型電器則沒有這個詢問設置。這個操作就講數據的劃分和用戶場景進行了有效的分辨。這種簡單的設置難道國內BAT的牛人們沒有想到么?做競品分析時候就沒人發現么?答案只有他們自己知道,但我個人認為他們太牛了不屑於了解這些設置也並不懂這種細微設定可以給數據可靠性帶來的作用有多大。因為他們都是基於技術層面的思考。

技術出身做數據分析和數據產品經理等工作有什麼不好?我不是瞧不起做技術的,至少我自學C和JAVA的時候知道做一名技術人員是有多難。我曾經用AS寫了個計算器用了一整天的時間,還只是實現了基本的計算功能(絕對的殘次品)。這就說明了一個問題既然一個人可以做程序員為什麼要跑去做產品呢?真相只有一個:他做不好程序員。做不好程序員這點重要麼?在互聯網行業這點很重要。程序員的收入在互聯網行業就像國企的員工,工作年限是個不可輕易逾越的鴻溝。在這個急缺碼農的時代基本上滿一年的程序員收入就可以過萬了。而數據分析一般不要應屆,產品大多是助理起步3年內沒有好機會參與項目,薪資都很難過萬。這裡提一下作者是商科出身為什麼能做產品因為商業工作不論年限論銷售技能,作者的邏輯能力和綜合知識遠遠超過銷售技能。

看到這裡就可以明白為什麼技術轉產品或者技術轉數據幾乎(用』幾乎』是不能把話說得太滿,大神還是存在的雖然目前這些大神還都不在人們視線內)不可取。有錢掙傻子才會放棄高薪去干錢少挨罵事雜的活,如果說認為做程序員累,那這麼懶得人你還能指望他干點啥?

最後簡單提一下SQL,這是資料庫的比較核心的語言,目前主流的資料庫都是根據SQL語言產生的。SQL可以做什麼呢?很簡單『增』,『刪』,『改』,『查』,當然還有一些邏輯處理。但是邏輯處理的邏輯需要時對的才有意義,錯誤的邏輯只會讓數據分析一錯再錯比如剛才提到的數據衍生情況。很多招聘啟事裡面都會寫明數據分析工作熟練掌握SQL語言最佳,面試時也會考量面試者是否懂編程或有基礎(大多傾向技術轉行的)。當然,了解程序語言是有好處的無論是SQL還是其他編程語言這樣在研發層面會減少很多溝通成本。

我有幸與朋友合作一個項目時認識了一位學者,這位學者和國內某知名互聯網企業的領軍人關係很好。他曾經在一次交談中告訴我這位領軍人所管理的企業雖然有很大的數據基數,但是也依舊困惑於不知如何正確使用這些數據。這裡要回到標題,數據分析我們到底分析的是什麼?我們分析的是人類行為,通過已有的行為對用戶進行預判的一種科學方法。其實數據分析在千年以來就已經有了實踐,從原始的商業行為中商人通過對一個地方的觀察和了解選擇銷售的商品,通過對一類人員的分析選擇營銷模式,這些都是數據分析的基礎和雛形。只是那時我們並不叫這為數據分析。在商科中有客戶行為分析,在心理學中有心裡剖析等其實都是數據分析可以借鑒的基礎。數據分析的標的物是人,只有對人這個具有獨立思想的物種進行分析才是有效的。無論是大數據還是互聯網時代都不可能脫離人為基準的工作。

作為一個中國互聯網的』老年人』,看著這些年輕人懷揣著夢想在不求甚解的狀態下探索挖掘互聯網,多少有些心痛。曾經有人問過我作為一個早期的網民對於互聯網有什麼不同看法?我的回答一切回歸原始,問題就看的通透多了,常年在互聯網遨遊的人相反不會把所有事情都蓋上互聯網的面紗。以上對數據的使用和分析純屬個人愚見。

GIF

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雨屋語 的精彩文章:

TAG:雨屋語 |