還糾結選機器學習還是深度學習？看完你就有數了

最新 04-05

導語：「機器學習」還是「深度學習」，哪個更適合我呢？

大哥你好，我是來學「人工智慧」的。但是，啥是「深度學習」？啥是「機器學習」？「深度學習」和「機器學習」有啥關係？我究竟該學「深度學習」還是「機器學習」？

在入門時，很多人都會被這幾個問題繞暈了。但相信我，看完這篇文章，所有的這些疑惑都會被解決！

搞懂概念

首先，我們來搞懂「人工智慧」、「機器學習」和「深度學習」這三個概念和概念之間的聯繫。

一、什麼是人工智慧？

人工智慧是通過軟體和硬體來「模擬」和「模仿」智能人類行為的研究。大家記得《終結者》里的天網和T-800嗎？它們就是「人工智慧」哦！

二、什麼是機器學習？

機器學習是AI的一個子領域，它通過演算法將AI概念應用於計算系統。計算機識別數據模式並根據數據模式採取行動，隨著時間的推移學習提高其準確性而無需明確的編程。機器學習的背後是預測編碼，聚類和視覺熱圖等分析方法。我們打開某寶、某東時的購物推薦就是機器學習的一個應用啦~

三、什麼是深度學習？

深度學習是機器學習的子領域，是人工神經網路的另一個名字。深度學習網路模仿人類大腦感知與組織的方式，根據數據輸入做出決策。AlphaGo就是我們最耳熟能詳的深度學習的應用！此外，雖然現在「天網」還沒出現，但是「天網」的基礎，深度學習已經出現啦！

簡而言之，機器學習是人工智慧的一部分，深度學習是機器學習的一部分，這就是三者的關係。

「機器學習」vs. 「深度學習」，我應該學哪個？

剛才說了，深度學習是機器學習的一部分，它們的關係就像「扳手」和「整套工具」的關係。因此，如果你想搞個應用，你更應該先學機器學習，了解一下整套工具。而是否要學習深度學習（扳手）要仔細考慮考慮——畢竟，深度學習是一個在發展中的技術，並且用花掉你大把的錢！（買顯卡……）

話說回來，深度學習雖然仍在發展中，但已經有很多深度學習的產品已經進入市場了，假以時日，深度學習的應用將會變得更加廣泛，這個扳手的作用將會越來越大。

深度剖析

現在，讓我們分別來了解一下「機器學習」和「深度學習」的知識和它們的應用案例吧！

一、機器學習詳解

機器學習通過演算法分析數據，從結果中進行學習，然後將「學習後的演算法」用來做出決策或進行預測，例子有我們熟悉的聚類、貝葉斯網路和視覺數據映射等等。

機器學習可以分成兩種類型——「有監督學習」和「無監督學習」。

監督式學習依賴於人為生成的「數據種子集」。這些「數據種子集」調教程序它該如何「看待」數據。

舉個監督室學習的例子，我有一套電子郵件數據，我給每一封郵件都打上「垃圾郵件」或「非垃圾郵件」的標籤，那麼，這套數據便是「數據種子集」，程序可以利用這套數據種子集進行訓練，從而得到一個判斷垃圾郵件的模型。

無監督學習是這樣的——觀察數據中的模式，將它們和其他的數據比較或進行搜索查詢。隨著數據集的增長、更多模式的浮現，機器學習演算法不斷「自我優化」。無監督學習的例子有聚類、概念搜索和接近重複數據刪除等等。

再以郵件為例，我有一套電子郵件數據，但是我並沒有人為的給它「打標籤」，而是直接進行聚類，程序會自動的分出「垃圾郵件」和「非垃圾郵件」。

機器學習的「基礎設施」差異很大。單一系統可以處理有限的數據，而大型系統則包含數十台伺服器和大規模並行處理（MPP）架構，用於跨多個數據源的海量數據。

二、深度學習詳解

深度學習，又叫人工神經網路，和其它所有機器學習一樣都是基於演算法。然而它並非像「數據分類」一樣根據任務選擇的演算法，而是模仿人類大腦結構與運算過程——識別非結構化輸入的數據，輸出精確地行為和決策。

機器學習可以是監督的也可以是非監督的，這意味著大型神經網路可以接受「標籤化輸入」，但並不需要。當一個神經網路處理輸入時，它通過輸入數據和輸出數據創造層，這種級別的深度學習讓神經網路從原始數據中「自動抽取特徵」而無需人工來貼標籤。

神經網路由大量被稱為神經元的簡單處理器構成，處理器用數學公式模仿人類大腦中的神經元。這些人造神經元就是神經網路最基礎的「部件」。

簡而言之，每一個神經元接受兩個或更多的輸入，處理它們，然後輸出一個結果。一些神經元從額外的感測器接收輸入，然後其他神經元被其他已激活的神經元激活。神經元可能激活其它的神經元，或者通過觸發的行動影響外部環境。所有的行為都是在「自動生成」的隱藏層中發生的，每個連續的圖層都會輸入前一層的輸出。

在實際項目中，神經網路大量攝取非結構化數據——聲音、文字、影像和圖片。神經網路將數據分離為數據塊，然後將它發送到獨立的神經元和網路層中去處理。一旦這些離散的處理都完成了，神經網路就產生最後的輸出，我們就大功告成了！

人工神經網路，或者說深度學習有什麼優點？它的一大優點在於「可擴展性」。神經網路的性能取決於它可以吸收、訓練和處理多少數據。所以，更多的數據意味著更好的結果——這是和「其它機器學習演算法」的另一個區別，其它機器學習演算法的效果通常穩定在一個明確的水平。深度學習僅通過資源衡量它的性能，層數更深，則輸出更為廣泛，性能也更為強勁。

所以，儘管深度學習不快也不容易，但是通過更低的價格能得到更好的計算能力這一點，還是讓各大公司「買買買」。

機器學習和深度學習的流行應用場景

機器學習已經在市場上「無孔不入」了，而深度學習還處於「初級階段」，商業化程度有限。

在某些應用案例中，二者可以說十分相似，區別在於神經網路可以增長到接近無限的學習和輸出規模；機器學習更受約束，適合具體的實際計算任務。

注意啦，「機器學習」和「深度學習」並非相斥而是互補的關係。

機器學習和深度學習的未來

你不會走在大街上就碰見「深度學習」，它們需要大量的標記數據進行監督學習，或大量的非結構化數據進行無監督學習。因此，苦逼的技術人員需要花費大量的時間標記和向神經網路輸入數據，或者需要輸入數以百萬計的非結構化對象來實現無監督學習。

在現代這個IT社會，缺乏數據不再是問題——挑戰是標記足夠的數據，或者將足夠的未標記數據導入神經網路。儘管處理能力不斷增加，價格也有所下降，但密集計算仍然需要對系統和支持進行大量的投資。

儘管如此，深度學習在許多不同的業務垂直領域都有很好的案例。像谷歌和Facebook這樣的深度學習大佬正在使用深度學習開發炫酷的應用程序，而其他的開發者們則在「跟著大佬走」。

不管怎樣，機器學習和深度學習是時代的大勢所趨。就像整個世界因為互聯網而變成了另一種樣子，機器學習也會重塑這個世界。在這個過程中，越來越多的人會認識到機器學習的價值，機器學習也會變得越來越容易上手。說不定有一天，小學生也要開始學習機器學習了。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 機器學習 的精彩文章:

※機器學習給製造業帶來巨大變革
※機器學習不能做什麼？

TAG:機器學習 |