12306網被黑,我只想知道我的個人信息還安全嗎?
12306用戶數據在暗網被兜售
隨後微博大V「花總」喊話泄漏者
希望對方站出來和平解決此事
無獨有偶,陌陌、萬豪酒店數據皆遭泄露
為何數據泄露如此頻繁?
我們的個人信息還安全嗎?
今日重磅福利
01
數據泄露, 人人難自保
最近,國內外大規模數據泄露事件密集發生,造成了群眾大面積恐慌。
12月10日,谷歌因可能出現的數據泄露問題關閉旗下產品;
12月3日,社交平台陌陌3000萬用戶數據在暗網被銷售;
11月30日,萬豪發公告稱旗下酒店喜達屋5億房客信息被泄露...
數據泄露是指「受保護或機密數據可能被未經授權的人查看、偷竊或使用」。互聯網行業則是數據泄露的高發領域。
* 圖片來源:澎湃新聞
大部分的數據泄露,是由於黑客的攻擊導致。IBM的研究報告顯示,數據泄露的主要原因中,惡意和犯罪攻擊佔到了48%。
* 圖片來源:IBM
而面對數據泄露,多數企業反應比較遲鈍。
* 圖片來源:IBM
IBM的研究報告發現,企業發現數據泄露的平均時間是197天,而控制住由此產生的後果還額外需要平均69天。發現和控制的時間越久,由此產生的損失也越高。
02
數據泄露會帶來多少損失?
數據泄露,將會給用戶和企業帶來不容小覷的損失。數據泄露將嚴重危害到用戶的個人信息安全,造成用戶對企業失去信任,從而引起用戶流失。
* 圖片來源:IBM
丟失用戶信任,造成用戶流失,對企業帶來的損失是巨大的。從IBM的報告中反映出,1%的用戶流失造成的損失為280萬美元左右。除此之外,不同行業的數據泄露成本也不同。
* 圖片來源:Gemalto
醫療保健行業成了數據泄露最多的行業,金融、政府、零售等行業也收數據泄露影響嚴重。
* 圖片來源:澎湃新聞
在監管較嚴的醫療和金融行業,數據泄露帶來的成本非常的高昂。而物流、酒店行業的成本相對較低。
除了用戶流失之外,數據泄露對公司造成的損失還有系統檢測升級、賠償罰款等方面。在監管較嚴格的地區,數據泄露的罰款非常大,由此帶來的股價下跌也經常發生。
03
為何數據泄露如此頻繁?
當今時代,數據泄露的頻繁程度,超出了我們的想像。
* 圖片來源:網路
報道顯示,在2018年上半年,共有46億條數據遭到泄露。平均每秒,就有291條數據泄露。為何數據泄露的頻繁程度如此之高?
1
數據市場需求旺盛
隨著互聯網的發展,用戶普及度的提高,數據市場的需求不斷提高,各行各業都離不開數據的支撐。例如,大數據的發展,讓醫療保健行業降低了不少的成本。
* 圖片來源:網路
從麥肯錫醫療行業大數據的報告顯示,大數據的發展,將幫助該行業減少12%-17%的成本,相當於節省了3000-4500億美元。除此之外,金融行業也對大數據有著極大的需求。
* 圖片來源:網路
金融數據對於機構投資者極為重要。一位高盛的高管估計,該行每年在金融數據上的花費就達到4億美元。而隨著科技手段的發展,機構投資者用於大數據獲取的成本還將進一步增加。
數據市場的需求增大,讓不少人看到了商機。因此,一部分人通過竊取個人信息進行交易,從中賺錢,使得用戶數據泄露的情況頻繁發生。
2
防範意識不強
一些企業認為自己並非互聯網行業主要參與者,不會成為被攻擊對象,因此在用戶數據保管上沒有做好安全措施,最終導致大批量用戶數據泄露。
此前華住集團數據泄露,可能原因就是開發人員安全意識不強,將公司程序代碼上傳到了GitHub(一個軟體託管平台)上,加之酒店資料庫密碼過於簡單才導致。
04
數據崗位究竟有多火爆
隨著互聯網信息化的普及,大數據相關人才的需求量越來越大,各行業大數據崗位開放的越來越多。以熱門的Data Analyst為例,光在紐約地區,就有接近600個崗位的開放。
* 圖片來源:Glassdoor
而同樣熱門的Business Analyst崗位,在紐約地區的崗位多達6000多個。
* 圖片來源:Glassdoor
從處理數據的各個步驟可以看出各個崗位的參與環節:
這裡介紹一下5個最常見的崗位:
1)數據分析師 Data Analyst:指熟悉相關業務,熟練搭建數據分析框架,掌握和使用相關的分析常用工具和基本的分析方法,進行數據搜集、整理、分析,針對數據分析結論給管理銷售運營提供指導意義的分析意見。2017年3月更新平均工資水平:
* 圖片來源:網路
2)數據工程師 Data Engineer:收集和處理大規模的原始數據(包括腳本編寫,網頁獲取,調用APIs,編寫SQL查詢等);將非結構化數據處理成適合分析的一種形式,然後進行分析;根據所需要的和專案分析商業決策。2017年3月更新平均工資水平:
* 圖片來源:網路
3)數據科學家 Data Scientist:通過統計模型、編程實現,設計、開發和部署能支持業務決策演算法和工具,管理大量數據,創建可視化以幫助理解。2017年3月更新平均工資水平:
* 圖片來源:網路
4)商業分析師 Business Analyst:中文也叫業務分析師。是一種介於客戶和IT團隊之間的角色,負責在IT項目中負責發掘、分析、傳達和確認客戶需求;同時了解有關業務上的各種問題並發現新的機會,搭建業務和IT人員之間的溝通橋樑,並推薦問題的解決方案以實現組織的目標。2017年3月更新平均工資水平:
5)市場營銷分析師 Marketing Analyst:主要幫助公司和組織決定以什麼價格,向哪些客戶,銷售哪些產品和服務。 通過研究市場條件,競爭對手的活動和消費者行為來得出結論。更專註於行業或公司內部的市場營銷職能,主要從市場的角度分析數據團隊提供的結果,給出建設性的意見。2017年3月更新平均工資水平:
* 圖片來源:網路
05
做數據分析怎麼入門?
業務方向學習路線:
1.沒有專業基礎(統計學、金融、數學、計算機專業)的可以從統計學、SQL開始學習。
2.對數學過敏的也可以先跳過統計學從Excel、SPSS開始,先熟練應用工具,再去理解背後的演算法。
技術方向學習路線:
計算機專業背景的的、走技術線的可以從Hadoop技術和R語言開始
非專業背景:入門找工作一般需要3-6個月學習周期
專業背景:1-2月
06
數據分析高頻面試題例舉
數據挖掘和數據分析之間的區別是什麼?
區別在於數據分析是針對個別屬性的實例分析,並提供值範圍,離散值及其頻率,空值發生,數據類型,長度等信息。而數據挖掘是重點關注聚類分析,異常記錄檢測,依賴關係,序列發現,多個屬性之間的關係控制等。
列出數據清理的最佳實踐?
按不同的屬性排序數據
對於大數據集,逐步清理並改進數據,直到獲得良好的數據質量
對大型數據集,可以先將其分解為小數據集,使用更少的數據將增加迭代速度
要處理常見的清理任務,請創建一組實用程序函數/工具/腳本。它可能包括基於CSV文件或SQL資料庫重映射值,或者正則表達式搜索和替換,消除所有不匹配正則表達式的值
分析每列的匯總統計數據(標準差,均值,缺失值的數量)
保持對每一個清理操作的跟蹤,以便可以根據需要更改或刪除操作
如何處理可疑或缺失數據?
準備提供所有可疑數據信息的驗證報告。它應該提供信息,如失敗的驗證標準以及發生的日期和時間,有經驗的數據分析師應該檢查可疑數據以確定其可接受性。應該找出無效數據並用驗證碼替換,對缺失數據進行處理,使用最佳分析策略,如刪除,單一插補方法,基於模型的方法等。
UniCareer VIP Coaching
一步打造金融行業通關秘籍
提升職場硬技能
識別上方二維碼添加
小希學姐(ID:UniCareerChina42)
備註【VIP】,立即諮詢課程
今日福利
※剛剛,澳洲最受歡迎公司Top100出爐:PwC居然第一
※剛剛,H1B又出新政,碩士背景申請中籤率提高16%!
TAG:UniCareer |