當前位置:
首頁 > 知識 > Linux系統讓我的機器學習之路如虎添翼

Linux系統讓我的機器學習之路如虎添翼

最早接觸linux是在高中的時候,那個時候基本什麼也不懂,每次閑下來的時候,都跑去網吧玩遊戲,由於零花錢有限,後來就想了很多外門邪道,平時有去黑客論壇的習慣,無意間就接觸了linux,那時候感覺很神奇,在一個黑色的框框里,瘋狂敲鍵盤,也是在那個時候學會了如何破解網吧管理系統,從此上網不在花錢了,哈哈哈。那個時候也就是接觸了一下linux,根本沒有去深入學習和研究。

上大學以後也是斷斷續續的學習linux,用到的時候看一點,並沒有深入的學習,真正的接觸linux還是要從學習機器學習的時候開始的。機器學習的門檻有點高,並不是一兩天就能學會的。當時看了很多資料,都不能很好的理解,特別是一大堆的線性代數和概率論,這些學完之後早就忘記了,所以大部分都很難讀懂,就這樣沒有規律的學習了一段時間,後來發現,這樣效率非常低,看了很多之後還是沒有理解機器學習,所以就下定決心從頭一點一點的惡補基礎知識。

首先從最基礎的數學開始學起,我經常問自己:如果我想要更好地學習機器學習,我該怎麼做,但我不知道我想學什麼?有經驗的人告訴我:很好的問題!我的答案是:始終如一地通過教科書。所以我一點一點的複習線性代數和概率論,這不是簡單的複習大學所學的簡單的線性代數和概率論,而是我們程序員所需要的線性代數和概率論。從中我理解到:近年來為了更好的進行數據處理,特別是大規模的數據處理。人們開始在各個學科中應用概率論統計。不管是數據挖掘,文檔的自動歸類,非法使用的鑒別還是垃圾郵件的自動篩選,還有語音識別和機器視覺,這些東西都需要概率論的理論支持。通過一段時間的學習,知道了多個隨機變數之間的關係,離散值的概率分布,連續值得概率分布,協方差矩陣,多元正太分布,估計和檢驗,偽隨機數等各種理論與實際代碼編寫的實現。

線性代數和概率論我惡補的差不多之後,我開始學習數據統計,數據統計學習的時間比較漫長,內容稍微有點多,最後大概是熟練掌握了spss之後,自我感覺能時間上手的時候,我就結束學習數據統計了。這個可以一直學習,不用一下子全都弄懂。

在這些都學習的差不多之後,開始重讀一些以前看不懂的書籍,看到理論知識並不在那麼的害怕他們,開始會自己一步一步的推導,直到結果成立。後來實際做項目,更加深了我對之前理解,拿一個普通的項目來說說吧。凱普斯通項目:使用一個數據集看看你是否可以預測給定的所有其他屬性的食品評分。使用三種不同的機器學習技術來完成這個任務,並證明你的首選。此外,建立一個分類器,預測審查是「好」還是「壞」 - 你應該使用合理的「好/壞」門檻。這將測試你的數據驅動能力,分析更大數據集的策略,機器學習技術知識以及在R中編寫分析代碼的能力。按照之後的經驗,就只會比著書上的代碼編寫,現在可以真正的理解為什麼要這麼做。最後介紹一下,如何實現。實現你代碼的部署,首先要掌握linux系統如何操作。這個以前的時候並沒有認真學習過。趁著這個機會。我就認認真真的學習了一下linux。我從網上搜了很多資料。包括書籍和視頻,做了詳細的對比,最終我選擇了《Linux就該這麼學》這本書。它讓我從一個小白,變成了一個熟練操作linux的人。

現在來說一下,學習過linux之後對操作系統的見解吧。

Linux在1991年問世,話說那個時候我還沒有出生呢,相較於windows系統,linux系統功能強大,上手之後操作十分方便,結構十分清晰,最大的特點就是開源,以致於短短几年的時候發展如此迅速。因此成為很多科研機構,學生老師的學習對象,還有學校目前已經開設了linux教程,可見linux系統的影響性之大。現在linux系統已經成為當今最流行的操作系統了,相較於windows,雖然windows上手快,簡單易學,但是對於科研工作者,許多功能,操作非常不方便,而且很多製圖,模擬軟體只能在linux或者unix系統下才能運行,因此很多公司推出了許多linux軟體,使得linux向商業化趨勢發展。

說了這麼多,來總結一下,要學習一門新知識,並不是籠統的比著人家寫寫看看就行了,要從根上解決,找一本書從頭到尾的研究透,這才是王道。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 Linux資訊速推 的精彩文章:

為什麼雲備份解決方案不充分利用雲計算?
詳解TogetherJS

TAG:Linux資訊速推 |