谷歌:「Cloud AutoML要實現全民玩AI」 國內公司:「我們早玩上了」
歡迎關注數據超市微信公眾號
谷歌雲AI研發負責人李佳(左)和首席科學家李飛飛
昨天,谷歌宣布推出AutoML Vision(直譯為:自動機器學習視覺),這項新服務可幫助那些沒有機器學習專業知識的企業,構建自定義圖像識別模型。李飛飛在Twitter連發兩條信息,激動地說:「在短短的幾個月里,將尖端技術轉化為數百萬的產品,這是一個相當鼓舞人心的旅程!我們希望AutoML Vision是我們客戶的第一選擇。」
使用AutoML Vision,任何人都能上傳圖片,然後讓谷歌的系統自動為他們創建機器學習模型。整個過程,從導入數據到標記和訓練模型,都是通過拖放界面完成的。
現在機器學習專家和數據科學家人才緊缺,而且即使擁有相關人才的公司,在創建和維護模型方面也需要耗費大量資源。
因此,這次谷歌提供的系統,不但能讓沒有機器學習專業知識的人創建ML模型,還將創建ML模型中所有艱苦麻煩的工作,包括訓練和調試,都承接了過來。
谷歌雲AI和ML首席科學家李飛飛本周早些時候在一個新聞發布會上說:「人工智慧和機器學習仍然是一個進入門檻高的領域,需要專業知識和資源,很少有公司自己能負擔得起。如今,雖然AI為企業提供了無數的好處,但是開發一個定製模型通常需要很高的專業知識和大量的資源。」
什麼是Cloud AutoML Vision
是個開發利器,能訓練出一個定製化的機器學習模型
通俗點說,Cloud AutoML是個開發利器,即便你不懂機器學習,也能訓練出一個定製化的機器學習模型。由於還在Alpha測試版的階段,目前這個服務僅支持計算機視覺模型,但谷歌表示稍後會支持所有標準機器學習模型,包括語音、翻譯、視頻、自然語言處理等。
目前已經可用的服務是Cloud AutoML Vision。
從此以後,一行代碼也不用寫
谷歌Cloud AutoML系統基於監督學習,所以需要提供一系列帶有標籤的數據。具體來說,開發者只需要上傳一組圖片,然後導入標籤或者通過App創建,隨後谷歌的系統就會自動生成一個定製化的機器學習模型。
據說,模型會在一天之內訓練完成。整個過程,從導入數據到打標籤到訓練模型,所有的操作都是通過拖拽完成。在這個模型生成以及訓練的過程中,不需要任何人為的干預。
總之,這個方法就是讓AI設計AI。現在谷歌又把這個技能放到雲上了。
現在唯一的問題是,谷歌沒有公布Cloud AutoML的服務價格,而且也暫時沒有對外開放。想要試用這個服務,需要向谷歌發出申請。
更精準 更快 操作簡單
Cloud AutoML Vision的詳細性能介紹
Cloud AutoML Vision(谷歌雲自動機器學習視覺系統)的特點:
更精準:Cloud AutoML Vision基於谷歌領先的圖像識別方法,包括傳輸學習和神經架構搜索技術。這意味著即使企業不具備足夠的機器學習專業知識,也可以獲得更準確的模型。
更快:使用Cloud AutoML可以在幾分鐘內創建一個簡單的模型,用以調試你想用AI支持的應用程序,可以在一天內構建能用於生產的完整模型。
操作簡單:AutoML Vision提供了一個簡單的圖形用戶界面,可讓你指定數據,然後將數據轉換為一個針對特定需求的高質量模型。
國內機器學習平台現狀
國內一些公司其實也涉足了類似於傻瓜版機器學習應用的平台
谷歌的AutoML Visions系統再一次把人工智慧機器學習推上了風口,國內一些公司其實也涉足了類似於傻瓜版機器學習應用的平台,下面小編就介紹幾個國內已經小有名氣的分散式機器學習平台:
阿里雲
數加 · 機器學習PAI
阿里雲機器學習是基於阿里雲分散式計算引擎的一款機器學習演算法平台,以極低的代價幫助您的業務從BI時代跨入AI時代,真正實現人工智慧觸手可及。
1
產品介紹
阿里雲機器學習PAI(Platform of Artificial Intelligence)是一款一站式的機器學習平台,包含數據預處理、特徵工程、常規機器學習演算法、深度學習框架、模型的評估以及預測這一整套機器學習相關服務。得益於底層的飛天計算平台的CPU集群以及GPU集群,PAI可以為用戶提供PB級別數據的高效計算保證。另外,PAI還將演算法組件進行封裝,並且增添了大量的可視化工具,讓用戶可以低門檻上手,真正實現人工智慧觸手可及。
2
功能特點
上手簡單:通過對底層的分散式演算法封裝,提供拖拉拽的可視化操作環境。讓數據挖掘的創建過程像搭積木一樣簡單。
提供最豐富的演算法:PAI包含特徵工程、數據預處理、統計分析、機器學習、深度學習框架、預測與評估這一整套的機器學習演算法組件,共100餘種。
一站式的機器學習體驗:PAI除了提供模型訓練功能,還提供了在線預測以及離線調度功能,讓機器學習訓練結果和業務可以無縫銜接。
支持主流深度學習框架:PAI已經包含了Tensorflow、Caffe、MXNet這三款主流的機器學習框架,底層提供M40型號的GPU卡進行訓練。
希嘉教育
數據超市
希嘉教育數據超市專門服務於高校科研老師,方便越來越多的站在科學前沿的科研老師們應用大數據技術對外部的大數據資源進行加工、分析和挖掘,尋找科研創意和證據,驗證科研的觀點,這是科研的大趨勢。但科研老師們往往很難找到可用的外部數據資源,缺少可用的大數據計算資源,並且還需要花費大量的時間鑽研大數據處理的演算法和程序,數據超市應運而生。
1
產品介紹
數據超市是能夠進行數據資源和計算資源的統一管控平台,提供了豐富的各類外部數據資源,提供了計算資源和豐富的演算法,計算結果將形成高清晰度的可視化圖表直接應用於科研論文中。是數據密集型科研的利器,讓每一位科研老師都能玩轉大數據。
2
功能特點
數據獲取
通過商務合作和數據採集,為學校提供高質量的外部數據資源高校用戶可以為科學增加大數據元素。
彈性存儲
彈性計算框架,可以支持從千億到百億級別的高效處理支持更多分析維度和更大的計算範圍。
分布計算
內置常用的機器學習等6大類50餘種演算法,無需對代碼進行開發,只要把對應的組件拖拽到畫布上,就可以完成數據挖掘,探索數據之間的隱藏關係。
可視化
內置常用的機器學習等6大類50餘種演算法,無需對代碼進行開發,只要把對應的組件拖拽到畫布上,就可以完成數據挖掘,探索數據之間的隱藏關係。
颸拓分散式機器學習平台
AInspir
颸拓 (武漢泰迪智慧科技有限公司)創立於2014年,由數位美國、加拿大海歸博士後創建的一家專註「人機對話交互」的人工智慧高新技術企業,颸拓是中文智能語義交互服務提供商。
1
產品介紹
颸拓分散式機器學習平台(AInspir)是一套基於大數據的數據挖掘解決方案,構建於分散式系統之上,以機器學習演算法和深度學習演算法為核心,提供海量大數據的接入、清洗、管理、建模、挖掘、可視化等功能。專註於金融、醫療等行業,進行深度知識挖掘,助力企業洞察潛藏在數據中業務價值。
2
功能特點
大數據支持,基於Hadoop和Spark技術,支持海量數據挖掘
深度學習支持,支持運行於GPU之上的深度學習演算法,大幅提高預測準確度和降低誤差率
多數據源支持,支持RDBMS、NoSQL、消息隊列和文本數據源
支持私有雲和公有雲部署
MaaS(Model as a Service)支持,模型雲端共享,降低建模成本,支持數據的集成接入
業務模型,建立行業模型,讓客戶更關注於業務
演算法組件化,提供數據源、數據預處理、特徵工程、統計分析、機器學習、文本處理六大類型的數據挖掘組件
GUI模型編排,採用Drag and Drop體驗式建模過程
第四範式
先知
第四範式是人工智慧技術與服務提供商。第四範式具備機器學習技術,能夠對數據進行精準預測與挖掘,幫助企業提升效率、降低風險,獲得更大的商業價值
由第四範式創始團隊開創的「遷移學習」被業界認為是「下一代的人工智慧技術」,第四範式在遷移學習領域保持著全球絕對領先的優勢
1
產品介紹
「第四範式先知」定位於企業級AI核心系統,由數據核心、演算法核心、生產核心三大模塊組成,覆蓋了人工智慧在生產中的各應用環節,在進一步降低AI開發門檻的同時,亦讓企業挖掘AI需求及應用AI更為簡單高效,幫助企業在AI時代從戰略、策略到執行全面智能化。
2
功能特點
數據核心
集數據接入與處理、數據管理與訪問於一身。支持結構化與非結構化的數據接入與處理,併產生海量高維特徵,保證特徵數據高速獲取的同時,將數據接入的時效性從T+1/T+N提升為毫秒級。
演算法核心
提供高維機器學習與深度學習訓練、基於深度學習的高維特徵生成、圖像文本以及圖關係的高維特徵挖掘等決策能力生成演算法;自動模型選擇、自動調參、特徵組合自動探索等降低機器學習成本及門檻的協助演算法,並圍繞NLP、知識圖譜,提供多種核心基礎服務及應用服務。
生產核心
私有PaaS架構,將數據服務、演算法任務、線上服務等基礎能力服務化,通過SDK介面調用,快速將服務轉化為具備高可用、可伸縮、可監控的應用程序。具備模型管理、灰度發布、多租戶、資源隔離、審計支持等企業級關鍵特性。
END
科學研究是希望發現這個世界的奧秘
而數據就是這個世界的底牌
-- 數 據 超 市 --
http://BigData711.com/