Mac上訓練機器學習模型,蘋果WWDC發布全新Create ML、Core ML 2
北京時間 6 月 5 日凌晨,蘋果 2018 年全球開發者大會 (WWDC) 在聖何塞的 McEnery 會議中心開幕。在去年的開發者大會上,圍繞軟、硬體,蘋果介紹了融合機器學習與人工智慧的產品,例如 CoreML 框架、智能音箱 HomePod 等。
而在今年的開發者大會上,蘋果的核心放在了軟體上。從 IOS 12 開始,庫克開啟了今年的 WWDC。而在機器學習方面,蘋果發布了最新的 Create ML 與 Core ML 2。
Create ML
Create ML 文檔地址:https://developer.apple.com/documentation/create_ml
在蘋果開發者文檔介紹中,Create ML 的目標是為應用程序創建機器學習模型。開發者可以使用 Swift 與 macOS 試驗場等熟悉的工具在 Mac 上創建和訓練定製化的機器學習模型,例如用於圖像識別、文本語義抽取或數值關係搜索等任務的模型。
據介紹,開發者可以使用具有代表性的樣本訓練模型來做模式識別,例如使用大量不同種類的狗以訓練模型識別「狗」。在訓練完模型後,開發者在模型沒見過的數據集上測試並評估它的性能。當模型有較好的性能時,就能使用 Core ML 將其集成到應用程序中。
Create ML 利用機器學習基礎設施建立進蘋果 Photos 和 Siri 這樣的產品中。這意味著你的圖片分類和自然語言處理模型可以變得更小、花費更少的訓練時間。
目前 Create ML 支持的任務主要包含計算機視覺、自然語言處理和其它使用標註信息進行預測的一般模型。在計算機視覺中,開發者可以訓練一個機器學習模型以完成圖像識別任務。重要的是,開發者在這一過程中可以使用 Xcode 試驗場的 UI 來訓練模型。自然語言處理主要展示了如何使用機器學習做文本分類,它允許創建文本級的自然語言分類與辭彙級地分類標註。
當然其它任務還有一般的分類問題與回歸問題,Create ML 允許開發者訓練一個模型以將數據分類為離散的類別或連續的數值。除此之外,Create ML 還展示了機器學習很多模塊,包括用來提升分類或回歸模型性能的度量方法和格式化數據的方法等。
如下我們將簡要展示如何使用 Create ML 創建圖像分類應用。簡單而言,我們希望給定分類器一些圖像的,然後它會輸出圖像的具體類別。當然首先我們需要準備一些訓練樣本,包括圖像與對應標註。然後在 Xcode 試驗場中創建一個 MLImageClassifierBuilder 實例,並以實時的方式查看:
// Import CreateMLUI to train the image classifier in the UI.
// For other Create ML tasks, import CreateML instead.
import CreateMLUI
let builder = MLImageClassifierBuilder()
builder.showInLiveView()
先顯示 Xcode 中的助理編輯器,然後再運行試驗場(Playground),這樣實時的方式就會顯示一個圖像分類器:
隨後的訓練和評估過程都是直接拖拽訓練數據集與測試數據集完成,非常方便。如下將測試數據集拖拽到圖中位置後就可以開始測試性能:
當開發者完成訓練並獲得滿意的性能時,一般就能保存為 Core ML 模型並添加到應用程序中:
Core ML 2
去年,蘋果發布了 Core ML。這是一個在蘋果產品上(包括 Siri、Camera 和 QuickTyPe)使用的設備上高性能機器學習框架。Core ML 能夠幫助開發者快速的融合多種機器學習模型到 APP 中,包括多層的深度學習模型以及標準的 SVM、線性模型等。此外,Core ML 為設備性能進行了優化,從而減少了內存佔用和功耗。嚴格在設備上運行能夠確保用戶數據的隱私,並且能保證你的應用在沒有網路連接時也能夠工作和響應。
Core ML 支持用於圖像分析的 Vision;用於自然語言處理的 Foundation(比如 NSLinguisticTagger 類)和用於評估已經學習到的決策樹的 GameplayKit。Core ML 本身構建於低層面的原語(primitives)之上,比如 Accelerate、BNNS 和 Metal Performance Shaders。
今天,蘋果發布了 Core ML 2,一個更好的升級版本。據蘋果軟體高級副總裁 Craig Federighi 介紹,相比於上一版本使用 Batch 預測速度快了 30% 左右,使用 Quantization 模型大小減少了 75% 左右。
小結
歷史 2 個多小時 Keynote,蘋果介紹了自己的多個軟體。除了發布 Create ML 與 Core ML 2 之外當然還介紹了其他在人工智慧領域的應用,例如隱私保護、Siri、圖片等。
其實,從 2016 年 Backchannel 對蘋果人工智慧的專題報道開始,人們對這家公司的 AI 研究與產品都極為關注,而後這家公司在 AI 方面的動作不斷。最近,蘋果從谷歌挖來了 John Giannandrea 來負責機器學習與 AI 策略。此外,一直也有消息透露蘋果在開發自己的晶元來加速計算機視覺、語音識別等 AI 應用。
期待未來蘋果在產品融合人工智慧上給我們帶來更大的驚喜。
※從圖像處理到語音識別,25款數據科學家必知的深度學習開放數據集
※機器學習時代的哈希演算法,將如何更高效地索引數據
TAG:機器之心 |