深度解讀華為雲AI戰略:如何靠AI贏得下一個十年?
10 月 10 日開幕的 2018 華為全聯接大會(HUAWEI CONNECT 2018)現場,華為輪值董事長徐直軍詳細闡述了華為的 AI 戰略,並推出了全棧全場景的 AI 解決方案,正式向整個 AI 業界宣告華為入場...
總體來說,華為人工智慧的發展戰略是以持續投資基礎研究和 AI 人才培養,打造全棧全場景 AI 解決方案和開放全球生態為基礎。
所謂全棧,是從縱向的技術功能視角來看,包括晶元、晶元使能、訓練和推理框架、應用使能在內的全堆棧方案。所謂全場景,是指從橫向來看,華為的 AI 解決方案可以用於包括公有雲、私有雲、各種邊緣計算、物聯網行業終端以及消費類終端等部署環境。
當然,華為 AI 全棧全場景,離不開華為雲。同時,華為雲 BU 雖然成立時間不長,但實際上是站在巨人的肩膀上前進——目前來看華為過去 30 年所積累的無論是軟硬體技術的能力,還是基於運營商在網路方面的經驗,及終端消費者客戶的經驗,對華為雲 BU 來說都是一個很好的積澱。
華為雲 BU EI 服務產品部總經理賈永利表示:「華為雲從成立第一天就是帶著全棧整合優勢出現的。」以全棧技術為核心武器,在過去一年裡,聚焦企業端的華為雲在 8 大行業、200 多個項目中,將行業智慧不斷與 AI 進行融合,把 AI 能力擴展到了交通、物流、製造等無限場景。而這一切的支撐來自華為雲貫通軟硬體各個層面的技術創新。
華為雲 AI 能力全面升級
基於新發布的昇騰晶元,華為雲從底層算力到軟體框架再到系統級服務進行了一次 AI 大升級,不僅進一步補齊 AI 軟體體系,也為行業 AI 更好地落地打下了基礎。
第一層進化:底層算力擴展
算力、演算法、數據是當前 AI 的三大基石,目前行業中產生的大量數據在清洗、標註、訓練上仍然需要消耗較長時間,因此算力仍是稀缺資源。
而算力的基礎又在於晶元,華為在 HC 上發布的兩款 AI 晶元昇騰 910 和昇騰 310 不出意料地成為熱點話題。
這兩款晶元均採用華為獨創的「達芬奇架構」。
昇騰 910 屬於 Max 系列,主打雲場景的超高算力,半精度算力達到 256 TFLOPS,比目前最強的 NVIDIA V100 的 125T 還高出一倍,是目前全球已經發布的單晶元計算力最大的 AI 晶元,採用 7nm 工藝,最大功耗 350W,將在明年第二季度上市。
昇騰 310 屬於 Mini 系列,採用 12nm 工藝,兼具高效計算和低功耗,算力可達 16TFLOPS,最大功耗僅 8 瓦,集成了 16 通道全高清視頻解碼器。這既是目前面向邊緣計算場景最強算力的 SoC,也可以應用在雲上。
我們都知道,中國的雲廠商還沒有做晶元的能力,在不少互聯網廠商 AI 晶元還僅存在於 PPT 里的情況下,華為已經將昇騰 310 用於華為雲,使 AI 的推理能力成為高端虛擬機的標配,用戶可以獲得 16 倍的推理算力。
如果覺得這個算力還不夠,華為雲還會在 AI 增強型的虛擬機和容器中,提供高達 512T 算力的服務;針對訓練場景,華為雲還將提供 ECS 和裸金屬形態最高 2PFLOP 的計算能力。
除了 H6 服務,華為雲還提供 Ai1、At1、Physical.At1 服務,全部基於昇騰 AI 晶元,有了這一系列雲服務,華為雲將全面進入 AI 新時代。
當然,正如華為雲 BU EI 服務產品部總經理賈永利所說的:「算力肯定是華為的一個顯著競爭力,但是我不認為它是華為雲做人工智慧唯一的競爭優勢,而是其中一個優勢。」
第二層進化:全平台統一訓練和推理框架
在算力之上,華為還提出了完整的軟體堆棧,以實現一次性運算元開發、一致的開發和調試體驗。
目前大部分 AI 演算法都需要在雲端訓練,進而在終端部署。但大部分雲廠商都不提供終端晶元售賣,晶元廠商也不提供雲計算服務,所以,一般 AI 應用在訓練跟部署之間一定會經過一次以上的底層計算環境遷移——對企業而言這是一個無用的「內耗」,既耗費人力物力,又浪費時間。
這對於開發者本人而言也是件麻煩事,因為轉換底層環境涉及到很多演算法跟運算元的調校,很容易出現明明在雲上跑得好好的,一換計算環境應用效率就跌。因此,華為希望能夠用同一套框架,打通華為公有雲、私有雲、邊緣計算、手機等不同 AI 應用場景,讓 AI 應用只需要一次調校,從而大大簡化部署工作。
運算元庫 CANN 能夠兼具最優開發算力和運算元性能,其中 TensorEngine 實現了統一的 DSL 介面、自動運算元優化、自動運算元生成以及自動運算元調優功能。值得一提的是,華為在 TensorEngine 中採用了陳天奇等人提出的 TVM。以 Reduce_sum 開發案例為例,使用 CANN 能將開發效率提升三倍。
Mindspore 則是華為提出的統一訓練和推理的 AI 框架,將於明年第二季度正式對外發布。Mindspore 支持深度學習、強化學習、增強學習,能夠靈活適應不同資源預算的部署環境,可以在雲、邊緣、端提供一致的開發體驗,同時支持所有主流機器學習和深度學習框架(包括 TensorFlow、PyTorch、PaddlePaddle、Keras、ONNX、MXNet 等)。在發布會上,華為還介紹了 MindSpore 設備端深度學習框架,大小只有 2MB 不到,運行時佔用內存不到 50MB。
CANN 和 Mindspore 共同構成了「全棧全場景」的核心基礎框架。
第三層進化:一站式 AI 應用開發平台
除了稀缺且昂貴的算力,阻礙 AI 產業規模化發展的根本原因還有一個,就是開發效率低。標註、訓練、部署整個過程不僅費時,還極其費力。為了解決這個問題,華為推出了普惠 AI 開發平台 ModelArts。
ModelArts 是面向 AI 開發者的一站式開發平台,提供海量數據預處理及半自動化標註、大規模分散式訓練、自動化模型生成、模型調優,及端 - 邊 - 雲模型按需部署能力。
同時,ModelArts 能夠在 AI 開發全生命周期中,從原始數據、標註數據、訓練作業、演算法、模型、推理服務等,提供全流程可視化管理。支持千萬級模型、數據集以及服務等對象的管理,無需人工干預,自動生成溯源圖,選擇任一模型就可以找到對應的數據集、參數、模型部署在哪裡。其中最實用的訓練斷點接續功能、訓練結果比對功能,在華為內部開發者中也頗受歡迎。
簡單來說,ModelArts 的特點是「四快」:
數據準備快
數據標註與準備對於很多 AI 開發者來說是最為痛苦的一項工作。曾有開發者吐槽,光是準備數據就要佔掉整體開發時間的 70%。ModelArts 內置 AI 數據框架,以 AI 的機制來治理數據,用迭代訓練來解決標註的數據量問題。尤其在數據量龐大的場景中,帶來的直接效益是數據標註與準備效率達百倍的提升。
上手快
ModelArts 具備自動學習功能,支持模型的自動設計與自動調參等,能夠幫助開發者提升開發效率、快速上手。
對於有經驗的開發者,可以在 ModelArts 上自行編寫並導入演算法代碼,核心組件 MoXing SDK 支持豐富的模型庫、優化演算法和各類工具庫;支持自動超參數調優;包含訓練 - 驗證 - 預測 - 模型導出的整套框架;開發者只需要編寫一套代碼就能自動實現單機及分散式化。
對於編程苦手卻想快速生成模型的 AI 初學者,ModelArts 也預置了能夠覆蓋大部分常用應用場景的演算法模型(如 RestNet_50、Faster_RCNN、SegNet_VGG_16 等,未來還將上線更多演算法模型),所有預置模型的基於開源數據集訓練,模型精度領先。只需配置數據路徑 / 日誌輸出路徑和 Hyper Parameter 自動選擇設置就可以一鍵啟動訓練。
訓練快
針對模型訓練耗時長的挑戰,ModelArts 通過各類優化技術,尤其是級聯式混合併行技術,在同樣的模型、數據集和同等硬體資源情況下,可以使模型訓練耗時降低一半。
在大量數據需要同步的情況下,大規模集群做分散式仍是當前的業界難題。目前大數據集分散式訓練在行業內的最好成績是 fast.ai 團隊在亞馬遜雲上實現的,通過 128 顆 GPU 實例同時運行,可在 18 分鐘內完成訓練,而華為雲 EI 可以用同樣的節點在 12 分鐘以內完成同樣的任務。
上線快
在 AI 規模化落地的場景下,模型部署會非常複雜。例如在智慧交通領域,以下場景非常常見——更新後的模型,需要一次性同時部署到各種不同規格、不同廠商的攝像頭上,這是一項非常耗時、費力的巨大工程。
對於此類場景,ModelArts 可以一鍵推送模型到所有邊緣、端的設備上,雲上的部署還支持在線和批量推理,滿足大並發和分散式等多種場景需求。
ModelArts 之外,華為還推出了專為視覺智能打造的開發工具 HiLens。
HiLens 由一個具備 AI 能力的攝像機和雲上開發平台組成,搭載昇騰 310,提供了強大的算力和存儲空間,可以滿足較大的圖像處理運算需求,甚至實現 1 秒百幀的處理能力及毫秒級人臉檢測。
同時,HiLens 內置的輕量級容器,具備資源佔用少、降低網路帶寬、下載啟動時間快等特性,因此也降低了系統實時處理的難度。
另外,HiLens 為個人開發者、企業和設備生產廠商提供了一整套安全可靠的一站式技能開發、部署和管理服務,可無縫對接客戶行業設備,增加業務開發效率、提升生產力。
HiLens 預置了豐富的模型和 Skill 能力,其中 Skill 由控制代碼和模型組成,AI 模型由 ModelArts 訓練,訓練後可以封裝為 Skill 開發基礎組件,簡化 Skill 開發。通過 HiLens 開發生成的 Skill 可以直接部署到有昇騰晶元的任何端側設備中。同時 HiLens 也兼容其他主流框架訓練的模型,在部署到端側設備的過程中會將模型自動轉換為 MindSpore 模型,以提供最優性能表現。
在以往 AI 視覺場景落地的過程中,通常某種處理方法在研究和開發中表現良好,但在複雜多變的應用環境中,卻不時地出現問題。例如機器視覺檢測的人臉識別系統,在目標配合時識別率可高達 95% 以上,但在實際監控環境下,視覺檢測識別率就會大大下降。HiLens 提供在線利用每個設備獨有的部署環境數據,在線訓練針對設備的個性化模型,提高模型精度,極大增強用戶體驗。
ModelArts 和 HiLens 在大會發布當天均已上線華為雲 EI 平台。
除了這兩個面向開發者的大殺器,華為雲 EI 的全家桶相比去年剛推出時也變得更加豐富了。
截至目前,華為雲 EI 已經上線 45 款服務 142 類功能,在解決方案層面,針對不同人群,華為雲 EI 提供通用 API、高階 API 以及預集成解決方案三種不同類型服務。無論是數據科學家或數據演算法工程師、IT 開發人員,甚至是沒有 AI 背景的業務人員,都可以在華為雲上找到解決絕大多數場景問題的解決方案。
可以看出,華為雲想要打造的是打通底層硬體到上層軟體應用、開發者與行業兩手抓的全方位 AI 生態體系,並且不是僅僅停留在想法、戰略或口號層面,這些都是華為雲已經做了和繼續在做的事情。
進擊的 EI 城市智能體
在與大會同期開放的展台上,華為 AI 的全場景全棧解決方案大部分都已經就位。上文提到的從全棧維度賦能開發者的 ModelArts、HiLens 等均有亮相,吸引了大量開發者的試用諮詢。基於華為 Ascend(昇騰)系列晶元和業界主流異構計算部件的 Atlas 智能計算平台,通過模塊、板卡、小站、一體機等豐富的產品形態,已經實現了將 AI 能力帶入雲、邊、端等全場景。
與此同時,華為雲 EI 行業解決方案的發布和展示也同步進行,應用案例涵蓋了公共事業、交通、金融、物流、教育、零售等眾多行業,包括三大運營商、微軟、英特爾,以及專攻行業智慧的諸多企業都匯聚現場展示了他們藉助華為雲 EI 為各自業務帶來的智能化變革。
去年 9 月,華為第二屆全聯接大會上,華為雲首次推出 EI 企業智能,主要包括基礎平台服務、通用服務(大數據、視覺認知、語音語義)、行業場景解決方案三大類;推出的當年,華為雲 EI 企業智能迅速攻城略地,把智能水務、智能製造、智能電力、智能交通、智能金融、智能零售六大行業解決方案推向市場。
今年 6 月,華為集 EI 企業智能、華為雲全棧能力大成於一身,推出 EI 交通智能體和 EI 工業智能體。華為雲 EI 智能體不僅基於歷史的統計,更是實時感知、互動和優化,實現真正的智能。今年的全連接大會正式發布了華為雲 EI 城市智能體,EI 智能體進一步升級。
針對行業智慧與 AI 結合,賈永利表示:「華為雲 EI 正從海量重複、專家經驗及多域協同等三大場景助力行業升級,實現效率提升、專業傳承和突破極限。」
其中,海量重複場景主要是指在企業實踐中尋找高頻出現的重複場景,例如華為雲 EI 深度學習和圖像搜索服務,支持中國圖庫每日數十萬新增版權圖片和數千萬網路圖片的自動入庫和交叉檢查,準確率達 99%。
專家經驗場景是指通過融入專家積累和經驗(行業智慧),使 AI 達到專家助手水平。例如,第三方醫學檢驗機構金域醫學與華為雲 EI 合作,在宮頸癌病理檢測方面取得階段性突破,敏感度(真陽性率)超過 99%,特異度(真陰性率)超過 80%。
對於涉及參數眾多、依賴關係複雜、維度高的異常複雜場景——多域協同場景,比如工業生產、城市治理等, 人工智慧技術也為這些領域帶來了新思路、新方法。
華為雲 EI 城市智能體就是多域協同場景的一個典型例子:在數字孿生的基礎上,通過 AI 協同雲、大數據、邊緣計算、物聯網等多種技術,實現從數據產生到數據分析、數據閉環的完整系統;通過數字世界強大的計算力,驅動物理世界更加智能。
目前,EI 城市智能體在交通、應急、環保、水務、水利、燃氣等場景持續探索高效的資源調度與配置,以解決更多城市難題,在效率提升、能耗降低、綠色環保等方面均有實際落地案例。
來自深圳市公安局交通警察局的李強處長就用幾組實際數字分享了採用華為雲 EI 交通智能體為業務帶來的顯著改變:
華為雲 EI 城市智能體幫助深圳交警在 2018 年上半年通過部署開車打手機、未系安全帶、刷臉執法等 AI 應用,深圳交警執法量增加了 15%;
深圳交警正在深圳龍崗坂田 43 個路口部署 EI 交通智能體 TrafficGo 解決方案,試點在線信號配時,關鍵路口等待時間平均縮短 17.7%;
構建新型運營指揮中心,深圳交警「鐵騎專項行動」應急反應時間縮短 67%。
還有一個離我們更近的案例,來自深圳機場。當前深圳機場每天航班起降超過 1000 架次,靠橋率約為 70% 左右,每天客流量 12 萬人。通過「+AI」,同時進行基礎設施的智能化改造,從傳統的甘特圖手工安排計划到 AI 的自動化,能夠使靠橋率提升到 80%。而這 10% 的提升,意味著每年將有 400 萬人不用坐擺渡車去遠機位。與此同時,深圳機場正在結合人臉識別實現機場一站式通關,目標是讓旅客的排隊時間減少 15%。
Cloud 2.0 時代,且看華為雲
未來,上雲會成為新常態,雲將是多數企業探索人工智慧的唯一環境,因為人工智慧需要海量的計算資源和存儲空間。 「雲 + 人工智慧」才是接下來推動產業變革的動力。
華為雲 BU CTO 張宇昕認為,Cloud2.0 時代的來臨,相對於過去十幾年互聯網的發展有顯著的不同。
第一,企業開始上雲了,尤其是企業的關鍵應用開始上雲了
過去,雲僅應用於個人娛樂和消費領域,而 Cloud2.0 時代,雲已經進入了生產領域。
第二, 傳統的互聯網應用出現瓶頸
過去,互聯網應用主要靠做流量紅利,誰能獲得更多的流量誰就能發展壯大。但是流量紅利終究會有天花板,而且流量紅利的模式很容易被複制。Cloud2.0 時代新的互聯網業務的核心從流量紅利變成了數據紅利。
張宇昕認為,在 Cloud1.0 時代,解決客戶難題的技術關鍵詞是分散式、自動化、大規模彈性,而在 Cloud 2.0 時代,光有這些技術已經遠遠不夠。企業應用和互聯網應用除了要求安全可靠之外,還有對智能化的普遍需求,這時拼的就是人工智慧、大數據,還有技術和全系統架構的實力。
正如我們在這次 HC 大會上所看到的,從晶元、硬體、整個數據中心開始,到基礎雲服務,再到應用開發的平台、應用的開發部署運維平台和工具框架,直到 AI 的基礎模型演算法和面向領域的行業解決方案,華為雲已經在垂直軸向上實現了諸多技術突破,足以應對未來的企業智能化挑戰。
Cloud2.0 時代,且看華為雲還會帶給我們哪些驚喜。
※微軟Azure雲服務故障超過24小時,原因竟是——被雷劈了
※編寫病毒程序取款700餘萬,華夏銀行一技術處長被捕受審
TAG:InfoQ |