超實用的機器學習&數據分析代碼小抄,送你了!
導語:今天,優達娘要給大家送一疊「小抄」(cheatsheet),乾貨滿滿,非常實用,隨時都可以翻看查閱,對 AI 和數據分析的初學者來說,簡直是不可多得的學習資源~
文/ Kailash Ahirwar
編譯/ 優達娘
來源/ startupsventurecapital.com
對於技術小白來說,初學數據挖掘技術以及人工智慧演算法有著相當大的阻礙。而現如今,Python 語言是學習數據分析以及機器學習深度學習的敲門磚。我們通過總結 Kailash Ahirwar 在 GitHub 主頁搜集的小抄(cheatsheet),將最受數據科學家和 AI 演算法工程師歡迎的 Python 工具總結起來,方便大家在平時的學習過程中查閱。
友情提醒,為了達到最佳閱讀效果,請「點擊看大圖,手機橫屏」,這樣看最爽。
1. Numpy
Numpy 是一種科學計算工具箱。相對於 Python 自帶的數組功能,它可以高效的處理線性代數,傅里葉變換等問題。它的後端是用 C++ 與 Fortan 語言所編寫,所以擁有著很快的計算速度。一句話:該小抄對於 Python 數據分析和機器/深度學習來說,同樣非常有幫助。
2. Pandas
Pandas 是一種強大的開源數據分析工具。其集成了數據分析所需要的多種功能,並且其與Numpy 工具箱完美兼容。也就是說,這兩張小抄主要用於數據整理。
3. SciPy
SciPy 生態系統是 Python 中用於科學計算的開源軟體的集合。其中包括核心包如 Numpy,Matplotlib,Pandas等等。
4. Matplotlib
Matplotlib 是一款 Python 繪圖工具, 其生成的圖像可以生成多種格式兼容多種硬體平台的列印。Matplotlib 可用於 Python 腳本,IPython shell,jupyter notebook,以及 Web 應用程序伺服器等。
5. Scikit-learn
Scikit-learn 是一款簡單高效,用於數據分析,數據挖掘,機器學習的開源工具包。其集成多種典型的機器學習方法,提供簡單易懂的借口,供所有人使用。它基於 Numpy, SciPy 以及Matplotlib。
6. Tensorflow
TensorFlow 是一個使用數據流圖進行數值計算的開源軟體庫。最初是由 Google 機器智能研究部門的 Google Brain 團隊中的研究人員和工程師開發的,用於進行機器學習和深度神經網路研究, 但它是一個非常基礎靈活的系統,因此也可以應用於眾多其他領域。
7.Keras
Keras 是一個用 Python 語言編寫的高級深度學習框架編程介面。其後端可以是 Tensorflow,Theano 以及 CNTK。一直以來,因其簡單易懂,快速上手的優勢為廣大程序猿(媛)所喜愛。一句話:該小抄對於 Python 數據分析和機器/深度學習來說,非常有幫助。
8. Jupyter Notebook
Jupyter Notebook 是一個開源的 Web 應用程序,允許使用者創建和共享代碼,方程,可視化圖形,以及敘述文本的文檔,並支持運行 40 多種編程語言。 其用途包括數據清理和轉換,數值模擬,統計建模,數據可視化,機器學習建模等等。
9. PySpark
Apache Spark 通常被用於大數據的快速分析,機器學習以及圖像處理。與當今其他工具相比,它可以使分析應用程序的速度提高數倍。 PySpark 是 Spark 應用於 Python 的介面。
除了以上這些,本文作者還搜集了其他的小抄,涉及到機器學習、深度學習以及數據分析,並且不斷在更新中,小抄的意義就是集精華為一體,為了讓大家方便查閱,溫故而知新,如果你也有更好更實用的小抄,作者歡迎你去他的GitHub進行擴展,項目地址:kailashahirwar/cheatsheets-ai。
— 完 —
快點掃我~
請問蛤蛤看的是什麼書?
TAG:機器學習 |