沒錢怎麼辦?為你介紹數據科學最具性價比的學習方法
本文為 AI 研習社編譯的技術博客,原標題 :
How To Learn Data Science If You』re Broke
翻譯 | 就2 校對 | 就2 整理 | 志豪
https://towardsdatascience.com/how-to-learn-data-science-if-youre-broke-7ecc408b53c7
過去的一年,我自學了數據科學,我從數百個網上資源開始學習,每天學習6-8個小時,同時我還兼著一份日間護理的工作賺拿著最低的工資。
我的目標是:開始我熱愛的事業,儘管我是個窮逼。
因為這個艱難的選擇,我在過去幾個月裡面完成了很多我之前沒想到過的工作:我發布了自己的個人網站,在一份重要的在線數據科學雜誌上刊發了我的文章,並且在拿到了一個競爭非常激烈的計算機科學研究生獎學金。
在這篇文章中,我會給出一些指導和建議,這樣你就可以自己安排學習數據科學課程了。我希望對於大家能授之以漁,讓大家可以開始在數據科學領域從事更有激情的工作。
一個簡短的說明
當我說到「數據科學」時,我指的是將數據轉化為現實行動的工具集合。這些技術包括機器學習、資料庫技術、統計、編程和領域特定技術。
通過下面的資源開始你的旅程
互聯網一片混亂。想從中找到學習資料,就感覺張開口從消防水龍頭喝水。
我給你一些更簡單的方法可以幫你解決這些問題。
Dataquest、DataCamp和Udacity等網站都提供數據科學技能課程。他們有收費的培訓課程,引導你從一個科目到另一個科目。每一門課都不需要你做什麼課程規劃。
啥?有問題? 他們太貴了,而且他們不教你如何在工作環境中應用你學到的知識,並且他們阻止你探索自己的興趣和激情。
當然還有一些免費的課程,比如 edX和coursera,它們提供某門課程,專門針對特定的主題。如果你能從視頻或課堂環境中很好地學習,這些都是學習數據科學的好方法。
免費在線教育平台
你可以在上面網站上找到可用的數據科學課程列表。還有一些你可以使用的免費課程。看看David Venturi的文章,或者開源數據科學大師(編者:這是一個學習數據科學的開源課程)。
如果你喜歡閱讀, 我推薦《從頭開始數據科學》這本書 。這本教科書是一個完整的學習計劃,還有在線資源。你可以在網上找到完整的pdf格式的書(免費),或者從亞馬遜(Amazon)獲得一本實體書(27美元)。
這些只是為數據科學提供詳細學習路徑的一些免費資源。還有其他很多就暫時不展開講了。
為了更好地理解你在學習過程中需要獲得的技能,在下一節中我將詳細介紹一個更廣泛的課程指南。這是一份更深入的介紹,而不僅僅是一份課程清單或書單。
學習課程的指導原則
數據科學課程指南
Python編程
編程是數據科學家的一項基本技能。你應該熟悉Python的語法,了解如何以多種方式運行python程序。(Jupyter筆記本 vs 命令行 vs IDE)
我花了大約一個月的時間來回顧Python文檔、《Python最佳實踐指南》以及完成CodeSignal上的編碼挑戰。
提示: 請留意程序員常用的解決問題的技巧。 (發音「演算法」)
統計與線性代數
機器學習和數據分析的先決條件。如果你已經有了紮實的理解,你應該花上一兩個星期來複習一下關鍵的概念。
特別關注描述性統計。能夠理解數據集是一項很牛逼的技能。
Numpy,Pandas 和Matplotlib
學習如何載入、操作和可視化數據。
掌握這些庫對您的個人項目很重要。
提示:不要覺得你必須記住練習帶來的每個方法或函數名稱。如果你忘記了就Google吧。
查看Pandas Docs,Numpy Docs和Matplotlib教程。應該也有更好的資源,但這些是我經常用的。
請記住,學習這些庫的唯一方法就是使用它們!
機器學習
學習機器學習演算法的理論和應用。然後將您學到的概念應用於您關心的真實數據。
大多數初學者從使用UCI ML Repository的示例數據集開始。你可以擺弄這些數據並瀏覽指導ML教程。
Scikit-learn文檔提供了有關常用演算法應用的優秀教程。我推薦一個播客(http://ocdevel.com/mlg),這個播客提供了很多免費的 ML 基礎理論教育資源。您可以在上下班途中或在鍛煉時收聽。
生產系統
獲得一份工作意味著能夠將現實世界的數據轉化為實際行動。
要做到這一點,您需要學習如何使用業務的計算資源來獲取、轉換和處理數據。
亞馬遜網路服務,谷歌雲,微軟Azure
這是數據科學課程中最容易的部分。因為您使用的特定工具取決於您要進入的行業。
但是,資料庫操作是必需的技能集。 您可以在ModeAnalytics或Codecademy上學習如何使用代碼操作資料庫。 您還可以在DigitalOcean上實現自己的資料庫(便宜)。
另一個(通常)需要的技能是版本控制。 您可以通過創建GitHub帳戶並使用命令行每天提交代碼來輕鬆獲得此技能。
在考慮學習其他技術時,重要的是要考慮自己的興趣和激情。 例如,如果您對Web開發感興趣,那麼請查看該行業中的公司使用的工具。
執行課程的建議
1、概念來的比你學習的快。
實際上有成千上萬的網頁和論壇解釋了普通數據科學工具的使用。正因為如此,在網上學習時很容易走彎路。因為當你學習機器學習中貝葉斯方程,指不定就會被深度學習中的某些內容吸引,然後搜索到神經網路的知識,天,一下午不知不覺就過去了,而你忘記了最開始要做啥。
當你開始研究一個話題時,你需要把你的目標牢記在心。如果你不這樣做,你可能會陷入網路上任何吸引你眼球的吸引人的鏈接。
解決方案是,拿一個號的工具來保存有趣的web資源。這樣你就可以為以後的工作節省一些材料,並且專註於與你當前相關的話題。
我目前的Chrome書籤欄
好的方法是,你可以制定一個有序的學習路徑,告訴你你應該關注什麼。你也會學得更快,避免分心。
警告,當你探索感興趣的新話題時,你的閱讀清單會迅速增加到數百個。別擔心,這就引出了我的第二條建議。
2.不要有壓力。這是馬拉松,不是短跑。
自我驅動的教育常常讓人感覺像是在閱讀無窮無盡的知識圖書館。
如果你想在數據科學領域取得成功,你需要把把數據科學學習看作一個終生的過程。
記住,學習的過程本身就是一種獎賞,書中自有顏如玉嘛。
在你的學習之旅中,你會探索你的興趣,發現更多驅使你的東西。你對自己了解得越多,你從學習中得到的樂趣就越多。
3.學習->應用->重複
不要滿足於只學習一個概念然後轉移到下一件事。學習的過程不會停止,直到你把一個概念應用到現實世界。
並不是每個概念都需要在您的學習過程中有一個專門的項目。重要的是要腳踏實地,記住你正在學習,這樣你才能在世界上產生影響。
4.建立個人的作品集,讓別人看到你的能力並信任你。
歸根結底,當你學習數據科學時,懷疑自己的能力是你將面臨的最大的逆境之一。
這可能來自別人,也可能來自你自己。
你的作品集是你向世界展示你的能力和信心的方式。
正因為如此,在學習數據科學時,建立你的作品集是最重要的事情。一個好的作品集可以讓你得到一份工作,讓你成為一個更自信的數據科學家。
用你引以為傲的項目填充你的作品集。
你是否從頭開始構建自己的web應用程序?你有自己的IMDB資料庫嗎?你寫過一篇有趣的醫療數據分析嗎?
把它放在你的作品集里。
只要確保寫出來的代碼是可讀的,有很好的文檔,並且作品集本身看起來也不錯。
https://harrisonjansma.com/archive
這是我的作品集。發布作品集的一種更簡單的方法是創建一個GitHub項目,其中包括一個很棒的ReadMe(摘要頁面)以及相關的項目文件。
5.數據科學+ ____ =充滿激情的職業
來!填空。
數據科學是一套旨在改變世界的工具。一些數據科學家構建計算機視覺系統來診斷醫學圖像,另一些科學家則遍曆數十億條數據條目,以找到網站用戶偏好的模式。
數據科學的應用是無窮無盡的,這就是為什麼找到讓你興奮的應用很重要。
如果你找到了你感興趣的話題,你就會更願意投入到工作中去做一個偉大的項目。這就引出了我在本文中最喜歡的一條建議。
當你在學習的時候,睜大眼睛去關注那些讓你興奮的項目或想法。
斯蒂芬·斯坦鮑爾在Unsplash
一旦你花了時間學習,試著把這些點點滴滴串連起來,找到讓你著迷的項目之間的相似之處,然後花些時間研究從事這類項目的行業。
一旦你找到了一個你感興趣的行業,就把獲得該行業所需的技能和技術專長作為你的目標。
如果你能做到這一點,你就已經準備好了把你的努力工作和對學習的奉獻轉化為充滿激情和成功的事業。
最後
如果你喜歡探索世界。如果你對人工智慧著迷。然後,不管你的情況如何,你都可以進入數據科學行業。
雖然、這並不容易。
要激勵自己學習,你需要毅力和自律。但如果你是那種能督促自己進步的人,那麼你完全有能力自己掌握這些技能。
畢竟,這就是數據科學家的工作。充滿好奇心,自我激勵,對尋找答案充滿激情。
如果你想要更多高質量的數據科學文章,請繼續關注我們AI研習社喲。?
想要繼續查看該篇文章更多代碼、鏈接和參考文獻?
雷鋒網雷鋒網雷鋒網
※20分鐘教會車道保持功能!Wayve 公司的強化學習演算法有點牛
※新華三副總裁李立:建設智慧城市的三大誤區
TAG:雷鋒網 |