數據科學的大坑
最新
02-21
「無論在學術界還是工業界,數據科學尚在定義中。」
「面對數據有無數可能,但是只有一部分合乎道德(並且有趣)的問題需要我們花力氣去解決。」
數據科學需要的技能清單(多的有點嚇人):
探索性數據分析
可視化(用在探索性數據分析和彙報中)
數字面板和矩陣
對業務的洞察力
數據驅動決策
數據工程和處理大數據的能力(Mapreduce、Hadoop、Hive、Pig)
收集數據
構建數據管道(日誌-->mapreduce-->數據文件-->同其他數據合併-->mapreduce-->清除一些雜訊-->合併)
開發新產品,而不僅僅停留在對現有產品的使用進行描述上
寫專利
數據偵探
預測未來的行為或性能
將發現寫成報告,做講演或發表在學術期刊上
編程(R、Python、C和Java等)
條件概率
優化
演算法,統計模型和機器學習
講故事的能力
會提問題
做調查
搞研究
從數據中做出推測
開發數據產品
找到處理數據的方法,會根據數據規模改變分析策略
一致性檢查
對數據的直覺
和領域專家打交道的能力
設計和分析實驗
發現數據間的相關性,並嘗試建立潛在的因果關係
※雲天外:寫給自己的話
※實踐感受——感受抗聯精神,不忘青年使命
TAG:全球大搜羅 |