華為張寶峰:NPU釋放端側AI算力, HiAI帶來雲+端+芯三位一體能力
演講:張寶峰
編輯:克雷格
【新智元導讀】大數據、演算法和算理方面的突破,掀起了第三次AI浪潮。而在個人終端上,由於AI技術的複雜度,硬體環境上的種種限制,嚴重製約了AI的發展。為了解除AI在個人終端上發展的制約,促進整個產業更快、更好的發展,需要構建一個更開放的生態,Huawei HiAI應時而生。在3月29日2018新智元產業·躍遷AI技術峰會上,華為軟體工程部副總裁張寶峰詳解HiAI如何快速幫助開發者、賦能產業鏈。
張寶峰 華為軟體工程部副總裁
張寶峰,現負責華為終端 AI 軟體的開發和交付。華為諾亞方舟實驗室創始人,曾任實驗室副主任,負責數據科學領域的中長期技術研究管理工作,研究方向為數據挖掘、機器學習和人工智慧。中國核高基專家組成員和中國CCF大數據專家委員會成員。張寶峰1998年加入華為,在信息科技領域有超20年的工作經驗,有豐富的國際/國家標準組織活動經驗,曾任國際電信聯盟13研究組固定移動融合課題的報告人,中國通信標準化協會網路與交換技術工作委員會副組長。
以下為張寶峰的演講:
十分榮幸能夠有機會站在新智元的舞台上和大家分享華為這幾個月的一些變化,記得上次在這裡分享的時候,講的是如何在手機的真實場景下讓AI可用。近期手機行業很多公司也紛紛用AI技術提升照相本身的效果和效率,所以我們就把幾個月以來部署上線之後的一些思考和大家分享。
開放、平等、協作、快速和分享是我們所謂的互聯網精神的追求,這也是今天我想和大家分享的主題。
行業普遍存在算力、服務碎片化、人才獲取難等痛點,NPU釋放端側AI算力,開放生態激活AI應用場景
去年我們面臨的主要是計算力不足的問題,下半年我們在Mate10上發布了具有獨立NPU的晶元加速深度學習的模型。
現在我們遇到了另外一個問題:當用AI加速手機上所有功能特性的時候,用戶如何真正從AI當中獲益?現在標準的模式就是用戶下載APP,不管是購物APP還是訂酒店的,這些本身都是第三方應用提供的,用戶衣食住行的方方面面可能會面臨成百上千萬的APP選擇和服務能力,如何解決這個問題才是目前我們讓最終用戶直接獲益的最大挑戰。
還有一個問題,就是如何真正快速地把AI變成軟體技術能力。一個簡簡單單的廣告業務有那麼多複雜的數學要去理解,應用當中有算力的問題、性能的問題,如何讓普普通通的開發者快速地使用AI能力解決自己應用軟體的問題,解決用戶的痛點,這是我們看到的另外一個機會。
千金不易得,良將更難求。現在AI熱炒的情況下很難找到足夠多的資源解決產業的應用。相信所有做AI的公司都會面臨以上這些基本問題,而我們在做什麼呢?我們希望把這些東西開放出來。
去年我們在把AI能力賦予手機,想把手機變成個人助手,這個領域我們只是走了一小步,未來我們希望把三層能力全部開放給合作夥伴。
首先是晶元的能力,端側執行深度學習,相信能夠給非常多的軟體滿足基本需求,比如圖形圖像處理、視頻圖像分割和對象識別為主體的應用軟體。手機執行的高效也是非常大的挑戰,Foundation層面需要真正實現。
其次是簡化的能力,我們要把NLU和CV的能力開放出來。後面也會有些基本的例子,這裡可以先告訴大家一個數字:之前我們和一個合作夥伴聯調,只需要四個小時的時間就把基於文檔識別、文檔轉換、模型變換變成了原生能力,嵌入到了自己的應用軟體當中。這是AI Engine真正把產業化應用的成熟模型變成第三方合作夥伴可以用的工具。
第三就是服務和生態,我們追求整個AI能力的時候希望能夠從最終的用戶視角出發,用戶到底能夠從哪些業務當中獲益,所以我們希望能夠把這些東西快速觸及到華為所有的用戶當中。
這三層其實是華為把AI能力快速賦予整個產業鏈,加速AI產業的成熟。我們有幾個優勢:首先是模型的執行效率。往往在端側執行模型,特別是移動終端設備執行的時候會出現一個非常大的問題,並不是單純的計算力問題,還有可計算的問題。英偉達強調搞定GPU是118.5/Turrent Flops,我們其實要講的是每瓦功耗的指標。
另一個優勢是如何簡單和高效。這種成熟的模型在第三方嵌套的時候希望做到小時級的拼接,這樣開發的時候可以快速賦予軟體本身。完備的工具鏈是所有開發者夢寐以求的東西,最後就是成熟的服務生態。
典型案例:50倍效能比、20倍效率提升,側端運行效率提升300%
下圖是去年我們手機的指標,50倍的性效比、20倍的效率提升,其中一個業務可以達到接近300%的效率提升,單幀的渲染時間是2.5秒。
下面是我們和國外一家叫Prisma的公司做的,點擊以後可以看到基本的執行時間。
Prisma在歐洲非常流行,強調的是如何把一個圖片變成有藝術風格的,號稱「渣片變神器」,渲染成梵高油畫風格。通常情況下1幀渲染需要10秒時間,這就是我們加速的效果,未來以圖形/圖像為主的應用軟體端側的執行效率是非常本質的指標,所以應用要執行得快、執行得爽是一個很大的基礎。
應用開發方面,我們已經做了很多積累,調研了接近300多家在中國的合作夥伴,主要的需求其實還是CV、ASR部分。
中國也有非常多的公司提供這樣的能力,我們強調的是希望把這些能力賦予端側執行,哪怕沒有聯網的情況下也能夠真正地使用戶享受到AI帶來的便利,主要聚焦的方式就是直播、社交平台、拍照處理等等。
我們會把這些能力賦予整個產業鏈,希望這些工具和AI的模型能夠被別人最輕量級地集成到自己的應用軟體當中,比如購物的時候包括掃碼、服務推薦、身份證識別等等都可以封裝成為一個API,我們有了這樣的能力以後就可以使得合作夥伴做得更快。
下面是我們自己的相冊,基本功能就是把一系列照片當中最好的一張找出來。因為我們做用戶調研的時候經常遇到一個問題,用戶拍了很多張,同一個地方同一個場景,但如何找到最好的照片分享出來其實是很痛苦的。我們用了美學評分的模型,其實對我們相冊的應用軟體,開發的時候只需要兩行代碼嵌套到自己的業務邏輯就夠了。
同樣的模型Prisma也做到了,場景識別的模型以前是用在相機上面,但是Prisma有非常多的風格。這張照片如果是人像的話,如何才能找到人像風格最匹配的風格變化的模式,或者如何找到風景最合適的模式都是它的挑戰,集成的時候基本上也是用幾行代碼的時間就把一個基於圖片本身檢測場景的能力做進去。我們可以通過Java和JSON的方式幾分鐘把它變成代碼的一部分,然後幾小時把它變成應用軟體和可以使用的功能。
下面是去年我們做的服務直達,包括服務原子化,前幾天我們也做了免安裝輕應用的聯盟。這裡我們感覺到更多的是隨著AI能力的部署,用戶會面臨服務選擇的困惑,就是在一個恰當的場景下到底應該用哪個功能,打車、購物的時候可能也有好幾個不同的選擇。
這些基礎的能力如何才能真正有效地在恰當的時間、恰當的場景推送給用戶,需要基於用戶本身的場景、偏好和持續的學習來解決的。
成熟的服務生態與合作夥伴共贏,覆蓋35萬+開發者
我們會把這些東西變成一個一個的入口,讓最優質的品質服務商能夠找到用戶真正的需求,就是一個雙贏的局面。我們希望手機上本身的AI能力對用戶場景的判斷、對用戶行為的判斷能夠使能這些真正優質的服務商快速地把服務推廣到用戶那裡,這就是應用推廣方面我們的努力和嘗試。
現在華為HiAI生態已讓3.4億最終用戶受益,同時華為每年有1.5億台的出貨量,這些都是真正服務於廣泛用戶的基礎,通過整個產業鏈分享給第三方開發者的話差不多是35萬+的規模。
通過這樣的生態想要做到的就是能夠快速地讓華為的用戶受益。華為關注的是手機用戶真正的體驗,我們並不希望AI這個東西只是變成產品炒作的賣點,而是希望能夠讓最終用戶受益。
這裡我們也需要關注IDE,把剛才的Foundation和Engine的能力集成到Studio當中,通過幾個Button進行模型的調試,甚至會跟自己的模擬真機環境對接,這樣完全可以一鍵式地把自己的AI能力賦予端側軟體。其實這裡主要強調的就是集成的時間,我們不希望AI是一個神話,而是希望每一個應用軟體都能夠享受到這樣的基礎。
我們正在打造一個開發者聯盟,這都是我們正在運行的平台,近期我們也和新智元合作做了很多部署和推廣,真正的夢想就是要讓整個產業鏈最快速度地把自己的業務服務於華為的手機用戶。
我們希望能夠打造這樣的生態,快速地執行自己壓力比較大的軟體,內部經常說的是Make it possible。我們也在和抖音合作,就是如何精準地刻花一個人的對象,如果是以前CPU和GPU的話手機很快就會發燙,然後就無法真正持續,希望用戶通過這樣的機製得到最好的體驗,同時也能夠簡單、非常容易地把AI變成原生應用的一部分推廣出去。最後就是在整個大生態當中產生多贏的效果,用戶使用華為手機的時候享受到最好的人工智慧帶來的服務、便利和體驗。
這些就是今天我們想和大家分享的主題,讓AI走下神壇,不要過度地吹噓AI能夠帶來的東西,而是真正從用戶視角關注AI到底能夠帶來怎樣的用戶體驗和服務,只有這樣才能驅動整個產業鏈的良性發展。
【加入社群】
新智元 AI 技術 + 產業社群招募中,歡迎對 AI 技術 + 產業落地感興趣的同學,加小助手微信號: aiera2015_1 入群;通過審核後我們將邀請進群,加入社群後務必修改群備註(姓名 - 公司 - 職位;專業群審核較嚴,敬請諒解)。
※英特爾擬收購博通,高通究竟落入誰手?
※【區塊鏈大咖說】肖風:數字化遷徙最核心的是AI和區塊鏈
TAG:新智元 |