三方軟體深度體驗,解讀華為手機AI能力!
隨著AI技術的發展,商業化與行業落地已成為近兩年AI市場的核心。而作為全球第一大硬體入口的智能手機,AI又豈會放棄這塊「肥肉」,也正在從晶元、語音、視覺等各個方面加速湧入手機入口。
近期華為發布了P20智能手機,這是搭載了其自研的麒麟970 AI晶元的又一款手機。自2017年9月,華為率先在全球發布麒麟970晶元後,此前這款AI晶元已經先後落地華為Mate 10、榮耀V10等系列新品。
但是AI能力絕不是晶元和演算法的簡單疊加,在AI晶元與AI演算法的加持下,真正落地到軟體應用,提供更快的處理能力以及更優的軟體體驗,對於消費者而言手機的AI能力才有意義。
近期,我們通過深度體驗華為手機中來自系統層的軟體、自有APP、第三方APP,來從這三個維度實際感受一下,華為手機的AI能力到底在軟體層面表現如何。
系統軟體:場景識物
首先我們先看一下華為手機在系統層的AI能力,這些應用直接內置到手機中,可以說是企業打造的一些標杆應用,無論是在晶元算力、AI演算法以及軟體適配等方面都會花大工夫打磨。在系統層的應用上我們選擇了華為內置的商品識別能力進行體驗。
具體而言,喚醒華為手機後,無需解鎖也無需打開APP,只需從屏幕底部輕輕向上一划就可調出底部菜單欄,在華為手機的最右方有一個場景識物的功能標誌。它調用了華為手機的攝像頭功能,通過攝像頭對物體進行「觀察」識別,就可以識別出商品的信息,然後會為你推薦類似的產品。這些推薦的商品來自淘寶,如果你對那個感興趣就可以直接進入到淘寶中進行查看購買。
我們進行了兩組測試,首先先用華為手機掃描了一台空氣加濕器,經過1~2秒鐘的商品識別,它就識別出答案後就會推薦出類似的商品。從結果顯示來看,它推薦的前兩款都是巴慕達凈化加濕器,無論外觀還是顏色都與實際產品是一致的,可見它準確識別了這台加濕器,並且還根據物體識別推測了最接近的品牌。
此外,廣大女性同胞在看到一件漂亮衣服時,是否想第一時間就知道商品的品牌信息。我們又用華為手機的商品識別功能掃描了一位小姐姐的灰色外衣,識別成功後手機就推薦了相關品牌的外衣。
目前場景識物方面取得的效果,得益於機器視覺技術較為成熟,機器通過攝像頭能夠對三維物體進行感知識別。更重要的是華為將場景識物功能和淘寶平台做了無縫對接,構建了一個不錯的AI實際體驗場景。
通過這兩次體驗,我們發現華為手機對於商品識別能力做了很好的優化,首先無需APP內操作,而是直接從手機系統入口直接啟用,更加方便快捷;其次是物體識別時間較快,一般1~2秒內即可完成,並且準確率較高。
這對於喜歡購物的女士無疑是一大利器,街頭看到一件好看的商品,直接拿出手機識別就可以推薦出相關的產品,並通過淘寶獲取信息,用戶可以更便捷的「剁手」了。
自有APP:微軟翻譯
華為手機中的微軟翻譯是由微軟提供的技術支持,華為做的優化,以翻譯這個自有APP為例,我們看一下華為手機中自有APP的AI能力如何。
華為手機中的翻譯APP有4項功能,包括語音翻譯、文字翻譯、圖片識別翻譯、以及多人(多語種)會話,這裡主要用到的AI能力就是機器翻譯,也涉及語音識別、圖像識別。
這裡我們重點介紹語音機器翻譯和圖片識別翻譯這兩個功能。在語音翻譯中,設置好語種的轉換,比如中英翻譯,當我說出「你好,歡迎來到人工智慧的世界」,在華為手機上方就實時呈現出中文語音識別的結果,然後屏幕上實時呈現英文翻譯結果「Hello,welcome to the world of artificial intelligence」。你也可以翻譯的結果調整成其他語種。
可以看出語音翻譯首先在識別率上已經很高,並且正常的口語機器翻譯都可以呈現非常不錯的翻譯效果,語音識別與機器翻譯的準確性都較高。此外,翻譯速度採用實時翻譯的形式,當你說完一句話時,相關的英文翻譯已經輸出,這也體現出華為手機中AI晶元能夠為軟體提供更多算力,來保證用戶體驗。
圖片識別翻譯是指調用華為手機中的攝像功能,將所要翻譯的內容進行拍照,然後就可以立即呈現出你想要的翻譯結果。
具體來說,我們找了一篇英文新聞來考驗這項能力,篇章、片段對機器翻譯可謂挑戰很大,因為機器沒有理解上下文語境的能力。首先我先用華為手機將這三段英文拍照,大約不到1秒,在英文上方就呈現了中文的翻譯結果。
這裡涉及到兩大重要AI技術,一項是圖片識別,在用華為手機拍照後,它需要調用AI晶元中的算力快速進行圖片中的文字識別,然後在通過機器翻譯將英文翻譯成中文,其他語種之間的翻譯也支持。
從結果來看,首先整個圖片識別、機器翻譯整個過程用時不到1秒,可以想像華為手機AI晶元提供了足夠的算力,AI演算法進行準確快速識別,並進行翻譯,來使用戶瞬間獲得想要的翻譯結果,無疑華為手機AI的能力增強了用戶體驗。
第三方APP:Prisma圖片處理
Prisma是一個圖片處理APP,可以通過AI把你手機中的普通照片模仿出著名藝術家畫作的風格,在2016年一經推出便紅遍全球。但這一應用需要軟體對圖片內容進行識別,並進行相關的渲染等,在算力上要求很高,現有手機的處理能力,往往需要很長時間才能完成。
華為除了將AI晶元的能力落地到自己開發的應用中,還HiAI移動計算平台,向第三方開發者提供人工智慧計算庫及其API,可以讓開發者更好的調用華為手機的AI能力。而Prisma也是華為HiAI平台的一個開發者。
為了體驗第三方APP在華為手機AI能力加持下效果如何,我們特意找了一位清新脫俗的妹子作為模特,隨意站在辦公室一角拍了一張照片,光線、背景、構圖什麼的都不考慮。然後調用Prisma圖片處理功能,選擇了圖中的兩種渲染效果,經過大概近3秒的處理,就自動生成了圖中後面兩張渲染照片,是不是隨手拍的照片瞬間就有了藝術風格。
而在藝術圖片生成的背後,首先需要軟體對照片進行感知,識別出前後不同的物體、人像、背景,然後對不同的部門進行藝術風格的渲染,這背後需要大量的算力的支持,以及AI演算法對不同物體尤其是人像的識別、邊框的界定。而華為麒麟970 AI晶元中搭載的NPU(神經網路處理單元)的計算速度比CPU快了25倍,同時還將能耗效率提高50倍,無疑這為Prisma提供了強有力的算力支持。
算力加持的效果就是Prisma的圖片處理速度更快,效果也更好,用戶可以在更短的時間獲得藝術風格渲染的照片,而不會出現處理速度過慢、卡頓等情況,從而增強手機與APP的用戶體驗。
有趣的是,一份Prisma在華為P20手機與iPhone X中處理耗時的對比圖可以看出,華為P20處理時間為3.2秒,而iPhone X則需要9.6秒,這無疑顯示出華為手機AI能力在第三方軟體層面的體現。
結語:三方軟體體驗看華為手機AI能力
通過華為手機中系統層軟體物體識別、自有APP微軟翻譯、第三方APP Prisma圖片處理工具三方軟體的體驗,我們可以看到在華為AI晶元、AI演算法等能力的加持下,無論是華為自有的軟體還是第三方的軟體都可以提升AI的處理能力,增強用戶體驗。
隨著華為將AI的能力以HiAI平台的形式開放給第三方開發者,開發者也可以調用華為AI的能力來增強自身軟體演算法的處理速度,進而提升自身軟體的體驗。
※深度報告:2018工業互聯網紅利爆發!阿里華為等16家巨頭瓜分
※為無人車造AI晶元這三年,地平線如何攥緊自動駕駛機會?
TAG:智東西 |