免費!數據科學必讀書單
數據科學是一個跨學科的領域,它包含來自統計學、機器學習、貝葉斯等領域的方法和技術,旨在探索特定的數據結構和內容。在本文中,我們列出了一些優秀的數據科學書籍,這涵蓋了數據科學領域的所有主題,而且可以免費查閱或下載。
1. Foundations of Data Science
鏈接:
https://www.cs.cornell.edu/jeh/book2016June9.pdf
作者: Blum, Hopcroft and Kannan
這本數據科學書籍是現代數據科學理論課程內容的完美結合。
2. UFLDL Tutorial
鏈接:
http://deeplearning.stanford.edu/wiki/index.php/UFLDL_Tutorial
貢獻者:
Andrew Ng, Jiquan Ngiam, Chuan Yu Foo, Yifan Mai, Caroline Suen
本教程旨在讓你熟悉無監督特徵學習和深度學習的主要思想。
3. Python Data Science Handbook
鏈接:
https://github.com/jakevdp/PythonDataScienceHandbook
作者:Jake VanderPlas
本書介紹了 Python 中處理數據所必需的核心庫:特別是IPython,NumPy,Pandas,Matplotlib,Scikit-Learn 和相關軟體包。
4. Hands-On Machine Learning and Big Data
鏈接:
https://www.gitbook.com/book/kalkaseer/hands-on-ml-and-bigdata/details
作者:Kareem Alkaseer
本書是學習機器學習和大數據概念的重要資源。
5. Think Stats
鏈接:
http://greenteapress.com/thinkstats/
作者:Allen B Downey
這本書可以教你使用簡單的技術來探索現實中的數據集,並解答一些有趣的問題。這是數據科學領域最受推薦的書籍之一。
6. Think Bayes
鏈接:
http://greenteapress.com/wp/think-bayes/
作者:Allen B Downey
這本書通過一些計算方法介紹貝葉斯統計的知識。此外,本書使用 Python 代碼而不是枯燥的數學知識,並通過一些離散近似而不是連續數學的知識來展示一些理論。
7. EE263: Introduction to Linear Dynamical Systems
鏈接:http://ee263.stanford.edu/
作者:Reza Nasiri Mahalati
Sanjay 教授在這本書中強調將線性代數和線性動力學系統應用於電路、信號處理、通信和控制系統。
8. Convex Optimization?—?Boyd and Vandenberghe
鏈接:
http://stanford.edu/~boyd/cvxbook/
作者:
Stephen Boyd and Lieven Vandenberghe
本書全面介紹了數值優化這個主題,並詳細展示了如何高效地解決數值優化這類問題。
9. Essentials of Metaheuristics
鏈接:
https://cs.gmu.edu/~sean/book/metaheuristics/
作者:Sean Luke
這是一套關於元啟發演算法的講座筆記,這個開放式講座面向本科生、從業人員、程序員和其他非專業人士。
10. CIML
鏈接:https://ciml.info/
作者:Hal Daumé III
CIML 是一套涵蓋現代機器學習(監督學習、無監督學習、大量邊際方法、概率建模、學習理論等)大部分內容的綜述性材料。
作者:Shashank Gupta
TAG:大數據實驗室 |