2018年最受關注10大Python函數包
在這個充滿母性光輝的日子,小X為大家推薦一款深受廣大女性同胞喜愛的數據分析工具——Python。Python以其優秀的可讀性、以及對統計分析的良好支持,在數據分析界越來越受歡迎。
今天,小X為大家介紹Python中最受歡迎的10大函數包,以及這些函數包的用處用法。
1. Numpy
Numpy是Python中做科學計算必不可少的函數包,它包含了很多科學計算需要的函數,可以支持向量矩陣的運算。它可用來存儲和處理大型矩陣,比Python自身的嵌套列表(nested list structure)結構要高效的多。
這裡附上一張Numpy的Cheatsheet鏈接:
https://s3.amazonaws.com/assets.datacamp.com/blog_assets/Numpy_Python_Cheat_Sheet.pdf
2. Pandas
Pandas是panel data的簡稱,panel data主要是兩個數據的類型:
time-series data; cross-sectional data。
Pandas可以讓我們很方便的在一個數據表(data frame) 中增加或刪除行、列;處理空值;以及很方便做聚合(aggregate grouping)運算。
一個series:
一個data frame:
這裡附上一張Pandas的Cheatsheet鏈接:
https://s3.amazonaws.com/assets.datacamp.com/blog_assets/Python_Pandas_Cheat_Sheet_2.pdf
3. Matplotlib
Matplotlib是Python中常用的可視化工具之一,便於創建海量類型2D圖表和一些基本的3D圖表。
這裡附上一張matplotlib的cheatsheet:
https://s3.amazonaws.com/assets.datacamp.com/blog_assets/Python_Matplotlib_Cheat_Sheet.pdf
4. Bokeh
Bokeh也是python中常用的數據可視化的函數包,它能很好的支持可互動式interactive 圖表,它獨立於matplotlib。
5. Scikit-learn
Scikit-learn 是基於scipy的數據處理上,支持machine learning的很多演算法,讓ML 演算法流程化,scikit-learn有很好的文檔支持,想要學習machine learning的同學,看看scikit learn的文檔會獲益匪淺。
6. Tensorflow
TensorFlow是Google在2015年11月份開源的人工智慧系統,是之前所開發的深度學習基礎架構DistBelief的改進版本,該系統可以被用於語音識別、圖片識別等多個領域。
官網上對TensorFlow的介紹是,一個使用數據流圖(data flow graphs)技術來進行數值計算的開源軟體庫。數據流圖中的節點,代表數值運算;節點節點之間的邊,代表多維數據(tensors)之間的某種聯繫。你可以在多種設備(含有CPU或GPU)上通過簡單的API調用來使用該系統的功能。TensorFlow是由Google Brain團隊的研發人員負責的項目。
GIF
7. NLTK
NLTK 是natural language toolkit的簡寫,NLTK可以支持自然語言文本分析,比如text tagging, classification, tokenizing, name entities identification等。
8. Scrapy
Scrapy 是一個針對網路爬蟲的函數包,它也可以用來接入API拿得數據。
9. Statsmodels
從名字就可以看出statsmodels是用來做統計學模型分析的函數包,它包含了常用的linear regression, generalized linear models, discrete choice models, robust linear models, time series analysis models等等模型。
除此之外,statsmodels也包含了一些統計繪圖的功能,在處理大型數據上,具有比較好的性能。
10. IPython
IPython是一種基於Python的互動式解釋器。相較於原生的Python Shell,IPython提供了更為強大的編輯和交互功能。
最後附上一個熱心網友整理的2017年python各大函數包在github上的數據,有哪些你喜歡的函數包在裡面呢?
以上就是數據科學家經常使用的一些python函數包。如果你有值得推薦的函數包,可以和Xcourse其他小夥伴一起交流。
Xcourse旨在構建一個面向未來,面向市場的學習平台,讓更多人進入大數據時代。關注我們的公眾號,回復「討論群」,即可加入討論群,讓大神帶你飛,還有數據分析師相關的職位推薦哦!
課程信息
Introduction toData Analytics
Xcourse推出的特別課程——「16天玩轉數據分析「,在幾天的時間裡,3月份的課程班就已全部報滿! 課程將於本周六正式開啟。
很多朋友諮詢小X下一期的開課時間,為了幫助大家儘快起步,早日加入數據分析的隊伍中,Xcourse將於4月推出同類型課程。
※大牛程序員總結了Python入門所需要掌握的知識點!史上超全的總結
※Windows下Python用管理員執行命令或者程序
TAG:Python |