Medium網友分享了一篇帖子 介紹了他的深度學習心路歷程
AiTechYun
編輯:Yining
Medium網友Favio Vázquez分享了他是如何學習深度學習並利用它來解決數據科學問題的。這是一個非正式的帖子,但內容很有趣。以下是他分享的內容。
關於我和深度學習的一點介紹
我的專業是物理和計算機工程。我在委內瑞拉學習過,後來在墨西哥做過物理學碩士。但我認為自己是一個數據科學家。因此,儘管我在數學、微積分和統計學方面有很好的背景,但從頭開始學習機器學習和深度學習對我來說並不容易。這些主題並不新鮮,但是我們研究它們的方式,我們如何構建使用它們的軟體和解決方案,以及我們與它們進行編程或交互的方式已經發生了巨大的改變。
我從哪裡開始著手?
在我學習計算機工程的時候,有一個關於「人工智慧(Artificial Intelligence)」的課程。對於這個課程,我時常會產生一些困惑。因此,我研究了專家系統(expert system),神經網路(neural net),遺傳演算法(genetic algorithm),並閱讀了一些論文,我發現其中兩篇非常有趣:
阿蘭·圖靈的《計算機器與智能》(Computing Machinery and Intelligence)
瑪格麗特·博登的《創造力和人工智慧》(Creativity and artificial intelligence)
當我閱讀這些論文之前(我不知道機器學習的進展,或者它甚至存在),我認為我們離實現真正的人工智慧還有很遠的距離。所以,那時的我(22歲)對人工智慧失去希望,於是我開始研究量子計算,對我來說,這是在人工智慧之前發生的事情。然而,看看下圖,事實證明我錯了:
我對人工智慧的興趣
在2014年(24歲),我剛剛從物理系畢業,在做我的關於黑洞模擬工程的論文時,我意外地發現了Coursera、機器學習、吳恩達和Apache Spark。這對我來說無疑是個巨大的驚喜。
我對嚴謹的在線學習感到驚訝,我以前沒有嘗試過這樣的課程(我仍然不知道為什麼),於是我開始學習所有的課程,從基因組學到天文學,從Scala到Python,從機器學習到S?ren Kierkegaard的哲學理論。
我沒有學習捷徑,也沒有導師,所以我只是在探索這個世界,試著找出我想要做些什麼。與此同時(2014年底),我在機器學習和Apache Spark項目中發現了吳恩達的課程,並在兩周內完成了這門課程,我簡直不敢相信這一領域有多麼驚人。然後我開始編寫我在Scala和Apache Spark中所學到的知識,因此我了解了分散式計算、Hadoop、HDFS以及所有這些偉大的東西。
我的一些早期(不是很好的)機器學習和spark的項目,你可以在我的GitHub上找到它們。
GitHub地址:https://github.com/FavioVazquez
我的第一個數據科學工作
我在2014年獲得了第一份數據科學工作,我是公司里唯一的數據科學家,試圖弄明白我們可以用數據做什麼。在工作中我發現,事情不像在課上學到的那樣簡單!我不再在R中導入Iris數據集,我處理的是奇怪的數據,並且我不知道數據在現實生活中是「骯髒的」。但我一直都在學習。有趣的是,我當時並不確定數據科學是什麼。我主要在Scala和Python中構建了一些簡單的模型。
然後過了一段時間,我意識到我喜歡開源(Open Source)。我開始在一些簡單的項目中進行合作,其中一些項目是我自己的,然後還有一些是Apache Spark這樣的大型項目。有簡單的項目,也有高級的項目,我覺得我是在為社會做貢獻。
宇宙冒險
Roger Penrose的共形循環宇宙學理論
數據科學是繼我對物理學和宇宙學之後的第二次熱情,所以我來到墨西哥做物理學碩士。這是一次令人驚奇的經歷,但仍有一些缺失。我需要代碼!我愛上了編程!
我選修了基礎物理課程,如經典力學,量子力學,但也有數值方法,高性能計算,以及貝葉斯推理和機器學習。在我的論文中,我用Python編寫了很多代碼,所以我很高興。
成為一名數據科學家
當我完成我的碩士學位(2017年)的時候,我決定我想做的是幫助大家成為一名數據科學家。是的,我花了一段時間。
如果你想知道我是如何在這個領域找到一份令人驚嘆的工作的,那就看看我在幾周前做的一篇博客文章:如何找到一份數據科學家的工作?
文章地址:https://towardsdatascience.com/how-to-get-a-job-as-a-data-scientist-f417078fe13e
我也開始在我的LinkedIn上分享我的經歷、想法和知識,這是非常重要的事情。我認識了很棒的人,這對我有很大幫助,現在我也在幫助別人。
LinkedIn地址:https://www.linkedin.com/in/faviovazquez/
每天我學習,代碼,在開源項目中做貢獻,並且幫助人們,所以我對我正在做的事情很滿意。
深度學習呢?
等等,看到現在,你可能想問,這難道不是一個關於深度學習的帖子嗎?
是的,但是我需要告訴你為什麼現在的深度學習對我來說很重要。
作為一名數據科學家,你需要更新理論、技術和框架;因此,去年我們看到了深度學習的爆炸式增長,就在我對機器學習開始適應的時候,這是一個全新的學習方式。
但是,你知道我從哪裡開始的嗎?
是的!正是吳恩達的deeplearning.ai的學習課程。
deeplearning.ai學習地址:https://www.deeplearning.ai/
我真的對他感到驚訝。當我才開始接觸這個領域時,他已經在教授這個領域的課程了。是的,我還在做這些課程。但我並沒有就此止步。我也需要更多的實用信息。
於是我開始學習TensorFlow,然後是Keras。Keras是一個高級的神經網路API,用Python編寫,能夠在TensorFlow、CNTK或Theano上面運行。這是由Fran?ois Chollet開發的,專註於快速的實驗。能夠從想法到結果,再到最少的延遲,是進行良好研究的關鍵。
有很好的學習實踐深度學習的資源,比如GitHub的repos和一些相關書籍。現在我正在閱讀《Deep Learning with Python》這本書,它對我的學習真的很有幫助:
註:這本書有中文版,AiTechYun截取了一些豆瓣網友對此書的評價。
深度學習的未來
預測是一種藝術,它告訴我們將要發生什麼,然後解釋它為什麼沒有發生。
我不知道如何預測未來。但我能說的是,我看到的是什麼,就會發生什麼。
我去年看到的深度學習的最好的東西之一就是Deep Cognition。這是創建和部署人工智慧的一個解決方案。簡單的拖放界面可以幫助你輕鬆地設計深度學習模型。Deep Learning Studio可以自動為你的自定義數據集設計一個深度學習模型,這要歸功於他們的高級的AutoML功能。
Deep Cognition:http://deepcognition.ai/
我認為圖形用戶界面(GUI)和AutoML可以是深度學習的未來。不要誤解我的意思,我喜歡編碼,你也可以在那裡編碼。但我認為,我們明年編寫的代碼數量將會衰減。我們不可能花那麼多的時間在全世界範圍內編程相同的東西,所以我認為GUI和AutoML將幫助數據科學家提高效率和解決更多的問題。
※DeepMind開源Psychlab,將人工智慧與心理學聯繫起來
TAG:ATYUN訂閱號 |