人工智慧–機器學習
人工智慧之機器學習ML
我們經常看到這幾個熱詞:人工智慧(ArtificialIntelligence)、機器學習(MachineLearning)和深度學習(DeepLearning),但是它們之間究竟有什麼區別和聯繫呢?
人工智慧(AI)的根本在於智能,即如何為機器賦予人的智能,這是一個非常大的範圍。
機器學習(ML)是指通過數據訓練出能完成一定功能的模型,是實現人工智慧的手段之一,也是目前最主流的人工智慧實現方法。人工智慧是科學,機器學習是讓機器變得更加智能的方法或演算法。
深度學習(DL)是機器學習的一個分支。深度即層數,超過8層的神經網路模型就叫深度學習。深度學習也是當下最流行的機器學習的一種。目前在語音、圖像等領域取得了很好的效果。
三者之間是從大到小的包含關係。
今天重點介紹一下機器學習ML。
機器學習直接來源於早期的人工智慧領域。
機器學習為什麼如此重要?機器學習之所以成為人工智慧背後的強勁動力是在於一個重大突破--互聯網的發明。互聯網有大量的數字信息被生成存儲和分析。機器學習演算法在這些大數據方面是最有效的。
機器學習最基本的做法,是使用演算法來解析數據、從中學習,然後對真實世界中的事件做出決策和預測。與傳統的為解決特定任務、硬編碼的軟體程序不同,機器學習是用大量的數據來「訓練」,通過各種演算法從數據中學習如何完成任務。機器學習則是機器通過大數據的輸入,從中主動尋求規律,驗證規律,最後得出結論,機器據此結論來自主解決問題,如果出現了偏差,會自主糾錯。
那麼什麼是機器學習呢?
機器學習ML(Machine Learning)是一門人工智慧的學科,一門多領域交叉學科,涉及概率論、統計學、逼近論、凸分析、演算法複雜度理論等多門學科。專門研究計算機怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識結構使之不斷改善自身的性能。
機器學習ML是人工智慧的核心,是使計算機具有智能的根本途徑,其應用遍及人工智慧的各個領域,它主要使用歸納、綜合而不是演繹。
ML defined byLangley(1996)-Machine learning is a science of the artificial. Thefield"s main objects of study are artifacts, specifically algorithms that improvetheir performance with experience.
ML defined byTom Mitchell (1997)- Machine Learning is the study of computeralgorithms that improve automatically through experience.
ML defined byAlpaydin(2004) - Machine learning is programming computers to optimize aperformance criterion using example data or past experience.
機器學習的本質是空間搜索和函數的泛化。無論使用哪種機器學習模型,都要經歷要經歷「建立模型」,「訓練模型」,「反饋」,「應用」的過程。而這個過程,跟一個嬰兒認識世界,獲取知識的過程是一樣的。培養機器建立人的認識的過程,就是「機器學習」。
機器學習常見分類:
1)有監督學習(supervised learning):從給定的訓練數據集中學習出一個函數,當新的數據到來時,可以根據這個函數預測結果。主要應用於分類和預測。監督學習的訓練集要求是包括輸入和輸出,也可以說是特徵和目標。訓練集中的目標是由人標註的。常用演算法包括人工神經網路(Artificial neural network)、貝葉斯(Bayesian)、決策樹(Decision Tree)和線性分類(Linear classifier)等。
2)無監督學習(unsupervised learning):與監督學習相比,訓練集沒有人為標註的結果。又稱歸納性學習(clustering)利用K方式(Kmeans),建立中心(centriole),通過循環和遞減運算(iteration&descent)來減小誤差,達到分類的目的。常用演算法包括人工神經網路(Artificial neural network)、關聯規則學習(Association rule learning)、分層聚類Hierarchical clustering和異常檢測(Anomaly detection)等。
3)半監督學習(semi- supervised learning):介於監督學習與無監督學習之間。結合了大量未標記的數據和少量標籤數據。常用演算法包括包括生成模型(Generative models)、低密度分離(Low-density separation)和聯合訓練Co-training等。
4)強化學習(Reinforcement learning):在這種學習模式下,輸入數據作為對模型的反饋,不像監督模型那樣,輸入數據僅僅是作為一個檢查模型對錯的方式,在強化學習下,輸入數據直接反饋到模型,模型必須對此立刻作出調整。常見的應用場景包括動態系統以及機器人控制等。常見演算法包括Q-Learning、時間差學習(Temporal difference learning)和學習自動Learning Automata等。
。。。。。。
機器學習研究內容主要包括三個方面:
(1)面向任務的研究:研究和分析改進一組預定任務的執行性能的學習系統。
(2)認知模型:研究人類學習過程並進行計算機模擬。
(3)理論分析:從理論上探索各種可能的學習方法和獨立於應用領域的演算法。
機器學習研究領域集中於兩個範疇:
(1)分類任務要求系統依據已知的分類知識對輸入的未知模式作分析,以確定輸入模式的類屬。相應的學習目標就是學慣用於分類的準則(如分類規則)。
(2)問題求解任務要求對於給定的目標狀態,尋找一個將當前狀態轉換為目標狀態的動作序列;機器學習在這一領域的研究工作大部分集中於通過學習來獲取能提高問題求解效率的知識(如搜索控制知識,啟發式知識等)。
機器學習應用廣泛,如:計算機視覺、自然語言處理、生物特徵識別、數據挖掘、搜索引擎、自動駕駛、醫學診斷、檢測信用卡欺詐、證券市場分析、DNA序列測序、語音和手寫識別、專家系統、認知模擬、規劃和問題求解、戰略遊戲和機器人等。
機器學習各種方法的應用範圍不斷擴大,一部分已形成商品。歸納學習的知識獲取工具已在診斷分類型專家系統中廣泛使用。連接學習在聲圖文識別中佔優勢。分析學習已用於設計綜合型專家系統。遺傳演算法與強化學習在工程式控制制中有較好的應用前景。與符號系統耦合的神經網路連接學習將在企業的智能管理與智能機器人運動規劃中發揮作用。
機器學習是繼專家系統之後人工智慧應用的又一重要研究領域,也是人工智慧和神經計算的核心研究課題之一。現有的計算機系統和人工智慧系統沒有什麼學習能力,至多也只有非常有限的學習能力,因而不能滿足科技和生產提出的新要求。對機器學習的討論和機器學習研究的進展,必將促使人工智慧和整個科學技術的進一步發展。
結語
機器學習是一門人工智慧的科學,該領域的主要研究對象是人工智慧,特別是如何在經驗學習中改善具體演算法的性能。機器學習是人工智慧的組成部分,是人工智慧的核心和前沿。機器學習的進展將不斷推動人工智慧向前發展。
※文字直接轉視頻,科學家用機器學習演算法實現這種操作
※智鈾科技完成Pre-A輪融資,將持續優化自動機器學習平台
TAG:機器學習 |