當前位置:
首頁 > 科技 > Google發布Cloud AutoML,「點擊一下,為所有人實現AI」

Google發布Cloud AutoML,「點擊一下,為所有人實現AI」

至頂網軟體頻道消息: 深度學習是去年Google NEXT雲大會的核心主題,Google提出了成為現代人工智慧中心的宏偉藍圖。昨天,Google正式發布了這一藍圖的下個篇章——Cloud AutoML Vision,讓任何人都可以通過上傳一組示例並單擊幾個按鈕來構建自己的深度學習計算機視覺模型。在一個點擊式深度學習的世界中,AI的未來可能會是什麼樣的?

Google發布Cloud AutoML,「點擊一下,為所有人實現AI」

僅僅在過去的兩年中,Google每年的深度學習研究都突出了人工智慧正在以不可思議的各種方式滲透到Google的各個角落,同時DeepMind也持續在深度學習方法基本能力方面實現突破。總的來看,像Google這樣的公司正在轉向利用深度學習的方法來自動化、加速和徹底重新思考一切事情,從服務用戶的方式到如何運行基礎設施。

簡而言之,深度學習方法正在構建或者改善數字世界不斷增加的演算法。神經網路還遠未完善,要看到智能AI系統在各種日常任務中超越人類,還需要一段時日。如今的人工智慧系統是專門為特定的應用而建立的,還有大量的人才和洞察力用來打造這些系統。

事實上,也許今天阻礙AI徹底變革商業世界的最大限制因素,就是極度稀缺的高度熟練和經驗豐富的深度學習程序員。目前,建立一個對未知數據有高度準確的、強大的、具有足夠性能擴展到生產工作流中的生產級神經應用,還遠未達到點擊式的體驗。創建最先進的神經網路,或者推進這個領域本身的發展狀態,都依賴於非常稀缺的研究人員,並且這中人才在矽谷之外很難找到。

十年前,大規模容錯虛擬化集群基礎設施也面臨同樣情況,現在它已經成為雲計算的代名詞。像亞馬遜、Google和微軟這樣的公司把雲帶到大眾面前,構建了專門的硬體,並且打包了大量專業技術,既推動了底層技術的發展,又通過與客戶合作實現超越自身的能力。在這樣做的過程中,主要的技術公司把自己所需要的基礎設施和專業知識,並將其出租給其他方,讓他們從他們開創的技術中受益。

今天,幾乎每個大公司對於如何利用深度學習是感興趣的,但缺乏可用的深度學習人才和建立一個深度學習團隊進行大規模深度學習項目的啟動成本。即使是那些已經開始深度學習的公司,也很少能夠達到像Google系統那樣的精確度或速度,而且Google也吸引了很多世界頂尖的AI人才。

Google在「AI for all」領域展開的努力,首先是圍繞著針對常見認知任務設計的預定義模型上構建的API,例如識別照片、OCR、依賴樹解析、翻譯等大約10000個預定義的對象。這些工作開展得很好,許多公司都有很高的特定領域的定製識別需求,可以完美利用Google神經識別基礎設施,特別是利用轉移學習將培新新模型所需的示例數量減到最少。

Cloud AutoML Vision代表著Google在這個點擊式神經網路嶄新世界中邁出的第一步。企業不再需要自己內部的人工智慧人員來利用深度學習:只需通過Web界面上傳幾十個示例圖像,點擊一個按鈕即可獲得一個訓練有素的神經網路,可以立即部署其具有生產準確性和生產規模,在神經準確度水平上每秒處理數百萬個請求。Google甚至提供自己的注釋人員來標記上傳的圖像,並與客戶合作??優化他們的訓練數據。

將圖像目錄拖放到一個文件夾中,點擊一下按鈕,獲得一個「正常工作」的神經網路,就是「AI for everyone」的核心。正如全球各地的企業利用雲來運行伺服器而不了解其巨大複雜性一樣,Cloud AutoML Vision提供了一個世界的預覽,在這個世界中,每個人都能夠在不了解底層的情況下構建神經網路。

事實上,Google將其稱肩負著「讓人工智慧民主化的使命......降低准入門檻,並使AI可用於最大可能的開發者、研究人員和企業社區」。企業將技術技能構建現金神經網路所需的經驗外包給Google,這為企業充分利用深度學習這場變革打開了一扇大門。

然而,Google在聲明中強調,Cloud AutoML利用了轉移學習,意味著企業不僅要將編程技術外包給Google,而且還要利用Google龐大的數據檔案和公司和該企業構建自己生產模式為Google提供支撐的資源。建立一個新的計算機視覺分類器來識別特定類型的雲?只需要轉移學習所需的幾十個例子就可以實現,因為基礎模型的構建需要大量數據和調優,這已經由Google根據自己的需要完成了。

當然,說到運行最先進的模型時,巨大的計算需求(通常將最大規模的專用定製晶元結合在一起)阻礙了大多數公司將注意力集中在模型的最大精度和規模上。Google在2016年關於其神經轉換架構的一篇論文指出,Google用了6天時間用96個NVIDIA K80 GPU來訓練模型,又用了3天細化處理。解碼是在44個物理核心的Haswell機器(88個虛擬內核)上進行的,使用這些CPU的處理速度可達到每秒4.5個語句,使用K80 GPU的處理速度可達到每秒1.9個語句,使用TPU處理器的處理速度可最高達到每秒15.6個語句。換句話說,如果沒有定製的TPU晶元,Google模型在44物理內核的機器上每秒只能轉換大約100個字。如無專門的TPU來協助,翻譯1000到2000字的新聞文章可以輕鬆消耗掉數百個處理器的資源。去年微軟的一篇論文概述了神經模型在生產中的成本是有多麼貴。

Google再一次將自己定位為終極的人工智慧計算設備,讓AutoML生成的模型通過其Cloud Vision或Cloud ML基礎設施能力立即運行,並充分利用其龐大的硬體投資。模型可立即擴展到生產流量水平,利用相同的硬體為Google自己的雲提供動力。

所有這些,Google首次發布的Cloud AutoML產品代表著我們在思考深度學習的方式上有了深刻的轉變。迄今為止,即使有雲廠商提供了神經模型託管服務,但企業仍然必須建立自己的人工智慧實驗室,並聘請深度學習研究人員來建立其模型。高端人工智慧研究人員的缺乏,以及訓練數據的缺乏,意味著很少有公司具有像Google這樣開發系統的質量和速度。今天,全球任何企業都可以將其所有的深度學習需求外包給Google,上傳幾十個示例,並讓Google處理注釋、模型構建和調優。不僅如此,由此產生的轉移學習訓練模型還利用了像Google這樣的大公司的龐大的基礎訓練數據。再點擊一下滑鼠,最終模型可以立即部署到生產中,處理「Google規模」的流量。簡而言之,Google全新的Cloud AutoML平台最終呈現了「點擊一下,為所有人實現AI」的夢想。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 至頂網 的精彩文章:

TAG:至頂網 |