當前位置:
首頁 > 最新 > 超實用的機器學習&數據分析代碼小抄,送你了!

超實用的機器學習&數據分析代碼小抄,送你了!

導語:今天,優達娘要給大家送一疊「小抄」(cheatsheet),乾貨滿滿,非常實用,隨時都可以翻看查閱,對 AI 和數據分析的初學者來說,簡直是不可多得的學習資源~

文/ Kailash Ahirwar

編譯/ 優達娘

來源/ startupsventurecapital.com

對於技術小白來說,初學數據挖掘技術以及人工智慧演算法有著相當大的阻礙。而現如今,Python 語言是學習數據分析以及機器學習深度學習的敲門磚。我們通過總結 Kailash Ahirwar 在 GitHub 主頁搜集的小抄(cheatsheet),將最受數據科學家和 AI 演算法工程師歡迎的 Python 工具總結起來,方便大家在平時的學習過程中查閱。

友情提醒,為了達到最佳閱讀效果,請「點擊看大圖,手機橫屏」,這樣看最爽。

1. Numpy

Numpy 是一種科學計算工具箱。相對於 Python 自帶的數組功能,它可以高效的處理線性代數,傅里葉變換等問題。它的後端是用 C++ 與 Fortan 語言所編寫,所以擁有著很快的計算速度。一句話:該小抄對於 Python 數據分析和機器/深度學習來說,同樣非常有幫助。

2. Pandas

Pandas 是一種強大的開源數據分析工具。其集成了數據分析所需要的多種功能,並且其與Numpy 工具箱完美兼容。也就是說,這兩張小抄主要用於數據整理。

3. SciPy

SciPy 生態系統是 Python 中用於科學計算的開源軟體的集合。其中包括核心包如 Numpy,Matplotlib,Pandas等等。

4. Matplotlib

Matplotlib 是一款 Python 繪圖工具, 其生成的圖像可以生成多種格式兼容多種硬體平台的列印。Matplotlib 可用於 Python 腳本,IPython shell,jupyter notebook,以及 Web 應用程序伺服器等。

5. Scikit-learn

Scikit-learn 是一款簡單高效,用於數據分析,數據挖掘,機器學習的開源工具包。其集成多種典型的機器學習方法,提供簡單易懂的借口,供所有人使用。它基於 Numpy, SciPy 以及Matplotlib。

6. Tensorflow

TensorFlow 是一個使用數據流圖進行數值計算的開源軟體庫。最初是由 Google 機器智能研究部門的 Google Brain 團隊中的研究人員和工程師開發的,用於進行機器學習和深度神經網路研究, 但它是一個非常基礎靈活的系統,因此也可以應用於眾多其他領域。

7.Keras

Keras 是一個用 Python 語言編寫的高級深度學習框架編程介面。其後端可以是 Tensorflow,Theano 以及 CNTK。一直以來,因其簡單易懂,快速上手的優勢為廣大程序猿(媛)所喜愛。一句話:該小抄對於 Python 數據分析和機器/深度學習來說,非常有幫助。

8. Jupyter Notebook

Jupyter Notebook 是一個開源的 Web 應用程序,允許使用者創建和共享代碼,方程,可視化圖形,以及敘述文本的文檔,並支持運行 40 多種編程語言。 其用途包括數據清理和轉換,數值模擬,統計建模,數據可視化,機器學習建模等等。

9. PySpark

Apache Spark 通常被用於大數據的快速分析,機器學習以及圖像處理。與當今其他工具相比,它可以使分析應用程序的速度提高數倍。 PySpark 是 Spark 應用於 Python 的介面。

除了以上這些,本文作者還搜集了其他的小抄,涉及到機器學習、深度學習以及數據分析,並且不斷在更新中,小抄的意義就是集精華為一體,為了讓大家方便查閱,溫故而知新,如果你也有更好更實用的小抄,作者歡迎你去他的GitHub進行擴展,項目地址:kailashahirwar/cheatsheets-ai。

— 完 —

快點掃我~

請問蛤蛤看的是什麼書?

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器學習 的精彩文章:

機器學習:基於網格的聚類演算法

TAG:機器學習 |