當前位置:
首頁 > 最新 > 數據需要連接,但是倫理需要重視

數據需要連接,但是倫理需要重視

數據的工作本質就是協同共創

無論是你缺少資源還是你缺少數據

車老師書中有個觀點,大數據產業目前面臨的挑戰,並不是沒有好的演算法,也不是沒有好的數據工程師,而是數據來源單一,這句話一定程度上,我覺得需要變化一下,不是數據來源單一,而是缺少發現和使用的眼睛。

事實上,今天的企業數據並不是很少,組織從小的狀態擴展到極大的狀態時,並沒有向重視業務一樣,並行的發展數據戰略,我們從來都知道數據有價值,但是價值如何衡量和詮釋,卻從未真正進行過。

車老師探討了,組織的部門之間的數據打不通的問題,這個問題在部分向阿里這類企業是現狀,但是在很多企業,或許不是完全如此,在金融,零售很多單元中,數據還是有一定程度的集中,儘管散落問題依舊存在,但是仍舊可以一定程度上解決。因為這些企業中,用數據來進行決策和推進業務的單元,似乎不是非常多。換個行業看,今天的互聯網,也不完全是出現很嚴重的這類打不通的問題。

回到剛才問題上,其實根源在於人才的問題。數據戰略和思維的匱乏造成了這種無法流通的弊端。大數據能力的根源是連接,而連接的基礎是數據的流通和標準化,這點說的很正確,不過這些所有的基礎在於人才,數據真正實現連接的前提是人與人之間的共通和連通,擁有一樣的數據戰略思維。

我們知道今天數據的增量比存量多,這恰恰是今天大數據時代最明顯的特徵。但是,我們在歡呼如此多元的數據和場景暢想的時候,其實我們最缺乏思考的是手裡的數據該如何進行審視,使用,要取解決什麼問題,存在什麼局限。我相信連接的前提也是需要,而不是盲目的連接。當然也存在一種情況是在連接中發現機遇。

在一定程度上,我個人堅持要把手裡面的數據整理清楚,完好,在場景驅動下,該如何連接更多數據,解決的需求痛點。不過車老師提到一點時,在使用數據時,數據本身可能早就出現了定義的變化,數據斷裂指的是數據已經不能反映當前現實。簡單說,數據的增長和變化超出了最初定義使用的範疇,無法準確描述業務,而這種情況下,所有數據流通必須建立在一個永恆不變的道理上,互惠互利,否則無法做到對數據進行適時修正。

這段話,我覺得是在談新的數據出現,在對已有問題的全新認識,而這類數據卻沒有與原有的數據進行互通和相互借力。

在一定程度上,我認同這個邏輯,尤其是政府部門間的數據問題,對於判斷一個人是否有偷逃稅的問題,可能很難通過簡單的繳稅申報數據來判斷,當智能電錶,或者其他設備的數據監測,也許我們會發現這個人的工廠每個月的用電量非常高,這與企業上繳的稅收不符合。這當中的數據互通式非常重要的。再比如今天的金融企業的風控授信問題,當混入了大量移動設備數據之後,在支付欺詐,風險判定方面,會形成新的邏輯和判斷標準,因為也許過去的風險判定方式,已經逐漸被用戶和一些人掌握了,形成了一定的反作弊和屏蔽能力。

作為企業,要實現數據的打通,需要有非常清晰的自上而下的數據資源戰略方向,也需要具備良好的,自下而上的協同能力,相輔相成。我個人的感受是我們需要更多的是數據思維的人才,需要從人才本身出發,尋找突破。戰略的事情,也是靠人的突破,因此這其中,如果基於數據思考,尋找共同的痛點,就是非常重要的,當把零散的數據一旦連接起來,則將發揮巨大的作用,比如當你把市場投放推廣的數據和實際的轉化收益數據結合,那麼至少從營銷戰略側重點上,是明確的,清晰的。

任何大數據的形成必須經歷兩個階段,開放和規範,兩者為遞進關係,前者是深度連接的前提,後者則是設計數據的可用性,實現從0到1的過程中,首先必須找到個體的與機構之間的平衡點。

拿一個互聯網企業來說,最初的發展是開放式的,數據也是基於不同的業務單元需要,野蠻生長,甚至可能漏掉了很多的數據,但是時間久了,業務慢慢正向發展了,我們會發現才開始關注數據的建設,如何挖掘價值,這個階段開始思考,怎麼把數據的建設起來,尋找價值,也就是車老師提到的可用性。這裡面,也需要平衡,也許有些事不是需要企業自己做的,比如今天遊戲企業選擇saas的數據統計服務,專業的廣告監測服務。成本與效益的平衡是很關鍵的。

順著剛才我們談到的遊戲統計分析服務來說,我們發現當企業用戶有這些數據後,需要下一步走出數據孤島,找出幾方共同痛點,當利益高於雙方競爭時,數據共享變得理所當然,比如今天我們會看到Appannie服務,第三方平台發布的數據報告,也都是基於此。

當然有了這些還不夠,當這些共同的數據,拿出來後,我們需要如何規範化。如何加工和使用是關鍵。就今天的金融科技市場來看,我們一般數據分成兩派,一類是堅持原始數據,保持原始樣貌,另一類則是將數據進行規範化和格式化,更具場景需要進行處理。所以有的是在交易原始數據,比如黑市,有的是給出來信用分。

不過總的說,數據本身不重要,而是解決方案最關鍵,沒有場景做目標的大數據如同散沙一樣,太具象,卻又不靈活。

剛才談的問題,其實也是今天數據難用的一個很大的問題,如果未來實現數據應用,良好的應用,則是要經理三階段:

對於一個企業中單獨存在的數據分析團隊而言,如果想要挖掘和實現的價值,得到認可的大前提,就是要將自己的服務和能力產品化,車老師的觀點是,數據分析的工作最終必須落在產品上。

車老師認為,數據產品設計的切入點必須要要問「目標問題是什麼」,「什麼樣的數據才能解決這個問題」。只有得到用戶的信任,我們才能做出更多的好產品,產品需要不斷迭代,而一勞永逸。

另一點很重要的是,對於產品化的關鍵點,是你的產品是能夠理解商業的,如果你不懂,那麼將不能是個好產品。

另一點車老師談到的是,沒有數據的人,期待有數據可用,而資源不足的公司,更懂得怎樣用好的自己的資源。這點的啟發還是很大的,簡單說我們培養多數據的一種態度和精神,對數據有信仰,要有思考,怎麼樣通過數據帶來價值,此外,當我們遭遇資源,能力不夠時,那就要怎樣發揮存在的能力和空間,不斷的提升和完善。協作配合,是解決這些問題的關鍵,數據的工作本質就是要協作和共創的。

另外今天還要探討的一個問題是關於倫理,大數據的關鍵破綻一章內容

前段時間爆發的阿里和順豐的事件,就是因為數據交換的問題互不相讓,最後切斷數據介面,導致淘寶用戶查詢不到快遞信息,這其中車老總結了兩個讓你踢:數據的公有權和私有權如何界定,數據流通過程如何保障個人,企業和公眾的應有利益?

車老師在寫本書的時候,堅持一個系統思維的邏輯,從提出了大數據的本質是連接,基於數據的連接,以及相互的相關性探尋,尋找解題思路,我們會在這個過程中,遭遇一些問題,比如連接本身是好的,但是在商業環境中和人的的參與中,數據並不是向我們想想的那般容易互通,這需要高度的數據戰略思維和共同需求的探尋。

不過在解決了連接問題後,探尋相關性的同時,另一個問題就出現了就是倫理問題。任何安全原則想要得到業務支持,必須要契合企業商業目標,風險承受能力和部署能力,今天大部分企業的管理層對數據安全還沒達成共識,要做到這些也很難。比如車老師談到,原本一些被匿名的身份,因為得到了另一個數據的關聯而被重新認證,風險級別忽然被提高,事前卻難以判斷。

要讓數據安全真正發揮作用,安全原則必須把人,過程和技術納入考慮範圍。在未來如果數據是商業核心,那麼數據安全策略不能落後,而是同步。

車老師說了一個案例,波士頓政府推出一個手機APP,旨在希望市民通過APP向政府報告路面坑窪的情況,這樣政府可以分配維修路面的資源,優先安排。但是最終發現,老人使用智能手機比率很低,導致收集的數據不全面,一些不影響年輕人的,卻會妨礙老年人的小型坑窪,被政府忽視了。

數據分析就是從龐大的體量數據中,提煉真相,但結果經常是「差之毫釐,謬以千里」。過去我們一直擔心小樣本導致的統計誤差,但是在大數據時代,這個問題還是存在,反而會更複雜,更難發現和解釋。

大數據引發的一系列社會問題,越來越多,這超出目前原則和法規的邊界,步伐已無法完全跟上。隱私,數據泄露問題層出不窮,合理的健全保護數據標準是必須要加速的。

當年Verizon也是通過在流量中植入追蹤碼,記錄客戶的特殊消費記錄,隨後,將數據提供外部廣告企業,進行針對性廣告投放,這違反了網路透明的規則,這類事在今天其實還是又發生,安全邊界還是很模糊。我們今天忽視,迴避和否認數據倫理問題,忽視是害怕,害怕檢查就露出破綻,害怕過度關注倫理會扼殺創新,害怕倫理問題太過棘手而無法解決。但需要的是,今天要積極改變數據安全策略。

最後一點,車老師談到的是,數據輸入問責制度將會越來越重要

為什麼說道這裡,在今天的深度學習和機器學習大行其道的背景下,在給定清楚目標的情況下,要餵食大量數據,比如AlphaGo早起版本就是學了大量人類的棋譜,進行不斷的學習和強化。而這其中就存在一定的倫理問題,比如在輸入目標和設計上,就可能會將偏見灌輸給人工智慧思維,比如大平台向男性推薦高薪工作的機會大於女性,美國警察系統判斷,非裔美國人比白人更容易被當成慣犯。此時,我們需要對這些輸入系統的數據進行某種程度的問責,確保準確性,將是非常重要的。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 愛分析 的精彩文章:

立足工具型產品,諸葛IO發力數字化營銷
為信託機構搭建消金業務系統,同牛科技預計拿下行業半數企業
定位智能營銷客服,快商通在醫美細分領域佔據優勢
橫跨消費與工業領域,AbleCloud重點布局數據服務
海致BDP肖昆:聚焦高數據價值領域,敏捷BI門檻在於產品能力

TAG:愛分析 |