大數據項目最差實踐有哪些?
大數據項目實踐中,多數同學更多關注最佳實踐,其實我們應該更加關注大數據項目最差實踐,在戰略規劃和實施中,知道「不做什麼」比「做什麼」更重要。走自己正確的路,讓別人犯錯去。下列是最差實踐的例子。
建了大數據平台,自然就有結果。很多企業有一個誤區,以為建BI系統或大數據平台就能解決業務問題、帶來價值。IT總是熱衷於技術的炒作,忘記了業務價值才是第一優先順序,數據分析技術僅僅是一個用於產生價值的工具。做大數據項目之前,要先考慮業務目的,建立業務案例(Business Case),然後才選擇和實施合適的分析工具。
軟體將回答所有問題。建一個分析系統,特別是跟大數據相關的,很複雜,資源要求高。結果,企業總是以為軟體像一個魔法棒一樣,能解決他們所有的業務問題。軟體只能輔助人解決問題,但更重要的是數據和具有解決問題能力的人。
相同的方式思考問題。如果期望重複相同的方法,得到不同的結果,那是愚蠢的。在大數據項目實踐中,針對結構化數據和非結構化數據,所使用的方法和工具完全是不同的,如果期望用傳統的BI來解決問題,必定會失敗。例如,結構化數據,可以用傳統的DW(Data Warehouse)架構設計,但非結構化數據,你可能要考慮Hadoop架構。
忘記過去所有的方法。比起相同方式思考問題,更可怕的是,忘記過去所有的方法,這是很致命的。例如,非結構化數據,並不意味著原先基本的數據管理規則需要重建。
缺乏必需的數據分析專家。一個錯誤的認識,是IT技術人員就能夠實施大數據項目。首先,為了產生業務價值,一個有效的大數據平台,應該把業務知識融入系統設計階段和後續的操作。其次,企業不能低估所要求的分析能力。例如,如果只是一些報表、儀錶盤,企業可以利用現有的BI系統,但大數據要求更高級的流程,包括用Machine Learning建預測、推薦等模型。所以,企業組織需配備Business Analyst/Data Analyst/Data Scientist。
忽視數據分析流程迭代的特性。通常,在數據分析流程中,收集和分析數據,併產生價值只是剛開始。真正有效的數據分析項目,是從數據分析中發現價值,然後根據結果反饋,優化分析模型,繼續發現新的價值,這是一個不斷迭代的過程。
答應和努力做更多任務。大數據項目經常掉進一個陷阱:誇大大數據系統的速度和帶給業務的價值。當你設置一個更容易和更快獲益的預期時,業務管理層易於低估難度,一旦遇到難題或資源不足時,你將很難達到業務管理層的預期,最終可能導致項目失敗。