可能你需要了解的機器學習?
什麼是機器學習
維基百科上是這樣說的:
機器學習是人工智慧的一個分支。
人工智慧的研究是從以「推理」為重點到以「知識」為重點,再到以「學習」為重點,一條自然、清晰的脈絡。
顯然,機器學習是實現人工智慧的一個途徑,即以機器學習為手段解決人工智慧中的問題。
機器學習在近30多年已發展為一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、計算複雜性理論等多門學科。
機器學習理論主要是設計和分析一些讓計算機可以自動「學習」的演算法。
機器學習演算法是一類從數據中自動分析獲得規律,並利用規律對未知數據進行預測的演算法。因為學習演算法中涉及了大量的統計學理論,機器學習與推斷統計學聯繫尤為密切,也被稱為統計學習理論。
演算法設計方面,機器學習理論關注可以實現的,行之有效的學習演算法。很多推論問題屬於無程序可循難度,所以部分的機器學習研究是開發容易處理的近似演算法。
其實要想真正的去理解機器學習,我們可能需要分不同的方法去研究它
機器學習
我們把機器學習分為三種不同的類型機器學習方法:
1、監督學習
2、無監督學習
3、強化學習
這三種不同的方法直接也存在著本質的區別,我們將來稍作分析
監督學習
我們通過監督學習可以實現對未來可能發生的事件進行預測
分類
利用分類對類標的訓練數據進行建模,對列表數據進行預測。
分類屬於監督學習的一個子類,目的就基於對過往類標一直示例的觀察學習,實現對新樣本類標的預測。
通過監督學習演算法構造的預測模型可以將訓練樣本中出現的任何類標賦給一個尚未被標記的新樣本。
回歸
針對連續型輸出變數進行預測,也就是我們現在要說的回歸分析。
在回歸分析中,數據結果中會給出大量的自變數【解釋變數】和相應的連續因變數【輸出結果】,通過嘗試尋找這兩種變數之間的關係,就能夠預測輸出的變數。
無監督學習
我們通過無監督學習可以實現在無已知變數和反饋的情況下提取有效信息
聚類
聚類屬於一種探索性數據分析技術,可以實現在沒有任何相關先驗的信息情況下,幫助我們將數據劃分為有意義的即簇【類別】。對數據進行分析時,生成的每個組中其內部成員之間具有一定的相似度,而與其他簇中的成員則具有較大的不同,這也是為什麼聚類有時被稱為「無監督分類」的原因
數據降維
數據降維屬於無監督學習的另外一個領域,我們每一次採樣都會獲得大量的樣本值,這也會增加學習演算法性能的難度,無監督降維就起到了降低某些演算法準確性的作用,提高數據處理信息中對數據特徵進行預處理的作用。並在數據可視化放面通過技術可以實現映射到一維、二維或者三維的屬性空間,並可通過散點圖和直方圖對二維、三維數據進行可視化輸出。
強化學習
我們通過強化學習可以達到系統性能的最大化利用
強化學習
強化學習的目標是為了構建一個系統,在與環境交互的過程中提高系統的性能。
比如象棋對決中,系統可以根據當前棋盤上的棋子狀態決定下一步棋落子的位置,而在遊戲結束給予用戶勝負的判定就可以作為一個激勵信號。
在通過與環境的交互,系統可以通過強化學習來得到一系列的行為,再通過探索性的試錯或者藉助精心設計的激勵系統使用正向反饋發揮到最大化。
小結
通過本文簡單的介紹,我相信小夥伴們應該對機器學習有個初步的認識。我們可以了解到監督學習由兩個重要的子領域組成:分類和回歸。其中,我們可以通過分類技術將對象劃分到不同的類別中,而回歸則能夠對輸出為連續型的目標變數進行預測。無監督學習不僅能從眾多的無類標數據中發現其整體結構,同時在特徵預處理階段的數據壓縮中也發揮了重要作用。
?
來者是萍水相逢,去者是江湖相忘。
※機器學習開發者會因谷歌AutoML失業嗎?
※大白話——機器學習
TAG:機器學習 |