當前位置:
首頁 > 新聞 > 「華為張寶峰」AI 嚇尿指數與終端智慧化未來的三大痛點(PPT)

「華為張寶峰」AI 嚇尿指數與終端智慧化未來的三大痛點(PPT)

「華為張寶峰」AI 嚇尿指數與終端智慧化未來的三大痛點(PPT)

新智元整理

「華為張寶峰」AI 嚇尿指數與終端智慧化未來的三大痛點(PPT)

華為在人工智慧相關領域的發展路徑選擇,也許將直接改變中國 AI+ 時代的產業格局和江湖面貌。對於這句話,有些人能迅速心領神會。

「華為張寶峰」AI 嚇尿指數與終端智慧化未來的三大痛點(PPT)

過去幾年,AI 已經成為華為的重中之重。新智元在和安卓綠色聯盟、中科院自動化所合辦的 6 月百人會閉門論壇上,特別邀請到華為 CBG 軟體工程部 VP、終端智慧工程部部長張寶峰做了專門的講解。張寶峰 1998 年加入華為,在信息科技領域有超過 18 年的工作經驗,目前負責華為終端 AI 軟體的開發和交付。他說:「對於手機終端智慧化的未來,我談談我的認知和理解,大家可以看看,哪些東西是對的,哪些是錯的。」也許,他的認知和理解,正是理解終端智慧化產業方向的一把鑰匙。

張寶峰簡歷:

張寶峰,華為 CBG 軟體工程部 VP,終端智慧工程部部長,負責終端AI軟體的開發和交付。曾擔任華為諾亞方舟實驗室副主任,負責數據科學領域的中長期技術研究工作,研究方向為數據挖掘、機器學習和人工智慧。中國核高基專家組成員和中國 CCF 大數據專家委員會成員。

張寶峰 1998 年加入華為,在信息科技領域有超18年的工作經驗,有豐富的國際/國家標準組織活動經驗,曾任國際電信聯盟13研究組固定移動融合課題的報告人,中國通信標準化協會網路與交換技術工作委員會副組長。


AI 已成為主驅動力之一——「嚇尿」周期變短,影響範圍變大

「華為張寶峰」AI 嚇尿指數與終端智慧化未來的三大痛點(PPT)

回溯人類發展的變化歷程,是一個越來越加速的過程。一百萬年前還是茹毛飲血時代的人,到了距今一千年前的農耕時代,見到了農耕生活的烤肉;一千年前農耕時代人去到兩百年前,或是那時的人來到現在,看到天上的飛機、使用的手機終端,他們能感受到什麼?

「華為張寶峰」AI 嚇尿指數與終端智慧化未來的三大痛點(PPT)

這代表了一個非常有意思的「嚇尿指數」,未來學家庫茲韋爾強調人類歷史發展的加速度。如果生活在若干年前的人被帶到今天的話,將被現在所謂的科技生活、交通現狀、社會本身的現狀所震驚。在幾千年、幾百年的社會發展中,科技進步扮演著非常重要的角色。談到今天的時代,毫無疑問是人工智慧。

「華為張寶峰」AI 嚇尿指數與終端智慧化未來的三大痛點(PPT)

自從計算機在象棋、圍棋方面打敗人類之後,就再沒被擊敗過。這次柯潔輸了之後,估計大家沒有太大興趣再跟機器比誰強誰弱。這個曲線還再繼續加速,加速過程中,我們認為未來很可能會超出我們自己的想像。


智慧革命和交互革命是未來驅動整個手機產業改變的兩大主線

技術本身是一個虛擬的概念,真正實現變革的是產品,是終端形態的變化。未來終端到底會以什麼樣的形式交互?我們的技術在其中扮演著什麼角色?

「華為張寶峰」AI 嚇尿指數與終端智慧化未來的三大痛點(PPT)

手機終端的變革,從最開始的模擬信號,只支持打電話功能,發展到了數字化的信息獲取時,手機已經可以代替電腦。而未來會是數字助理,如何給用戶真正最佳匹配,找到他自己想要的東西?信息能夠更高效、更便捷地驅動手機用戶從智能助理得到服務,這是我們真正追求的。

「華為張寶峰」AI 嚇尿指數與終端智慧化未來的三大痛點(PPT)

智慧革命和交互革命是未來驅動整個手機產業改變的兩大主線,如何真正產生更自然的交互?我們用手機的時候,從以前的按鍵,到今天的觸屏,到現在的語音,一代一代進展。如何用現代的人工智慧技術實現「可用」?比如喚醒,這個功能本身很容易,現在有幾種智能音箱都要馬上上市。但喚醒又很難做。安靜環境下,可以非常容易實現比較高的準確率。而到嘈雜環境的時候,比如正在播放音樂,或者有很多人聊天,這時正常喚醒,並且識別是你,就是一個很難的挑戰。這是一個新的時代。AI 給終端帶來的最大價值在於入口本身越來越精準,越來越人性,也就是越來越便利。

手機是一個現代 IT 技術集大成的設備,裡面有大量的感測和交互信息,如語音、文字、視頻、感測器,它能帶來的一個很大的變化,使現實世界更容易更方便地變成數字化,並且由於手機現在已經毫無疑問成為伴隨人每天工作生活時間最長的 IT 設備,它一定會產生非常重要的橋樑作用。


手機終端智慧化的未來——三大需求:理解用戶,主動服務,終生學習

對於手機終端智慧化的未來,我談談我的認知和理解,大家可以看看,哪些東西是對的,哪些是錯的。

「華為張寶峰」AI 嚇尿指數與終端智慧化未來的三大痛點(PPT)

第一,理解用戶。大量的感測設備或者智能交互設備出現了,包括以前的眼鏡、現在的手環,還有手錶、手機,這些終端圍繞某一個用戶,已經在大量刻畫所有的生活軌跡。圍繞每個用戶,有很多種終端同時為你工作的時候,需要真正懂你的代理,幫你代理終端本身的控制和交互。未來的終端裡面,終端泛化需要真正懂你的助理。虛擬世界裡面強調的是真正對「你」的理解和認知。未來 AI 往前發展,特別是對於消費者設備來說,這是第一個非常基礎的需求:如何真正懂你,並且實現多端協同控制。

「華為張寶峰」AI 嚇尿指數與終端智慧化未來的三大痛點(PPT)

第二,變被動為主動。現在業務服務都是以 APP 的方式提供給大家,這是標準的智能手機的商業模式。但終端現狀存在一些問題,比如一個用戶手機平均裝了一百個APP,任何一個功能,都有好幾個APP能完成。打車有好幾個APP,新聞閱讀有好多個APP,但是每個APP,都還有一些小眾化的需求是需要的。未來的智能助手,建立在用戶認知基礎上,替用戶完成初步篩選,便利的主動推送,真正主動探知用戶的需求,讓用戶一步完成想乾的事。這是我們看到的第二個趨勢,主動服務。

「華為張寶峰」AI 嚇尿指數與終端智慧化未來的三大痛點(PPT)

第三,智能終端的終生學習。終生學習並不是從用戶接入開始到用戶離開你的服務為止。類似人類從小孩到中年到老年,整個過程都能感知和認知,智能終端能不能在整個事件的生命周期內持續提供服務?比如從深圳來北京的一趟飛機,航班信息非常多,能不能決定一下選哪個?萬一有一些意外,能不能提供一個備選方案?包括出行,包括酒店,包括航班,一系列信息其實都是連續的,行程任務很明確,所有的一切是不是能夠替我在周期內完成?AI 整個能力部署之後,建立整個學習引擎之後,應該能夠提供一個場景化選擇適配的能力,能夠知道我的用戶的場景變化,以最佳的方式來完成我的任務,這裡面是持續性的學習過程,不是單次的適應過程。但是本身來講它是巨大的挑戰,如果從完整事件的高度看,這需要聚合各式各樣的 AI 能力拚成完整的系統,而這個系統本身的駐留產生終生學習的效果。通過成功完成每次任務,通過各式各樣人的群體測試的疊加,它就會越來越智能。這個智能系統才是可持續發展的系統,不是單次型的智能系統,部署完、訓練完就完了。這是從消費者解決方案的角度來看,AI 領域能夠帶來的非常大的變革性的場景化的需求。


終端智慧化的痛點:端側智能,產品線實測,深度學習

以上三點是比較值得和大家分享的潮流和趨勢,下面,我將提出來一些痛點,與行業內的專家們交流。

第一是端側智能,加盟 CBG (華為消費者 BG)之前,我夢想有一個超級強大的雲,一個在雲端持續處理的超級強大的大腦。但是我們去年發布 Magic 手機的時候,有一個客戶跟我提,用你們的手機正看著一個視頻,突然跳出來一個推薦,說蘇寧上賣的某個東西比京東上便宜 10 塊錢,這是系統不停在分析用戶本身的業務需求,客戶建議說,你們要控制一下這個。

另外,像輸入法這種模型,如果在手機上敲的每個字都要回到雲端,從這個角度去想,其實個人感受還是非常不舒適的,不知道未來的人是不是能夠適應這樣的東西。現階段社會裡面還是有非常多的人比較敏感,他也許會想,我現在敲的每個字都在雲端了,不知道你會怎麼去用,我交互的一切你都獲得了,我很擔心。

這裡有一個很重要的問題,遲延。今天上傳 1028×760 的照片,至少要秒級的時間上傳到雲端,加上分析的時間,一個來回需要1點幾秒甚至2秒以上,這樣的體驗在用戶很多場景下是不可接受的。我當時來到 CBG ,感覺到很大的問題是,不管雲側做得多麼准,從體驗看過去,消費者真正接收到的其實是速度很慢的、且交互體驗還存在很大風險的服務提供模式。

「華為張寶峰」AI 嚇尿指數與終端智慧化未來的三大痛點(PPT)

從今年的產業變化看,各大廠商也意識到了消費者這層心理問題。Google 的大會發布了 TensorFlow Lite。如果放到端側去,端側是否能兼容 TensorFlow 的引擎和平台,讓模型本身的東西在本地執行,現在還沒有到模型的訓練階段。

華為已經在嘗試能不能在本地進行簡單模型的增強訓練,或者簡單模型的生成問題。Facebook 提出的 Caffe 2 是一模一樣的故事,一樣是關於如何能夠真正在端側有一個通路的引擎平台,使大家更方便去運轉自己的人工智慧複雜模型的問題。

在嘗試端側的過程中,我們遇到的第一個問題是,如何在端側以用戶可以接受成本的情況下,真正執行我們自己的智能體驗,真正在端側智能提供有效簡化和信息獲取便利的技術,這在所有的 AI 智能交互部分都會有挑戰。

為了解決這個問題,我們在今年也會嘗試做一款可以支撐人工智慧模型在端側執行效率的晶元。

端側智能並不絕對代表雲側沒有事干,終生學習、感知、認知,其實很多是離不開雲的。但端側智能有客觀需求,從用戶角度還有做產品的角度都有客觀需求。這是今年遇到的挑戰和值得嘗試的方向。

第二,現階段衡量人工智慧水平非常重要的指標是語音識別,還有圖像分類。這兩點,大家都鼓吹已經超越人類,但是我們真正在產品線實測的結果還不成熟。

比如有些微信裡面往往設計非常花的背景,字體設計五彩斑斕,這種情況下使用 OCR 技術實現真正通用的自然識別準確率,估計是所有的研究團隊已經不再做的方向,但這是真正的實際指標。而語音識別在現實中有噪音的識別率是很低的。大家都在宣傳人工智慧已經成熟,已經超過人類,實際在真正應用場景裡面差距蠻大。這是給大家提出一個期望和希望,即能不能真正變成實用、可用的。

別光說理想環境裡面某個指標測上去達到百分之九十六、百分之九十七,甚至還在追求百分之九十七點幾的精度。能不能真正泛化起來把環境場景做複雜一點,不要做太大的約束,而是變得真正可用。

「華為張寶峰」AI 嚇尿指數與終端智慧化未來的三大痛點(PPT)

前面兩個指標都是跟端側有一定的相關性。一周前,我們項目組在討論一個非常簡單的圖像分類任務。960 × 960 的圖片在端側做分類不是很複雜的時候有 800 毫秒的時延,對人來說,操作時有感覺,相當於點了之後,頓了一下才會有交互的感覺。

在相機裡面疊加一個計算機視覺功能的時候,我們遇到的問題是,多了 200 毫安。大家可能對這個單位不是很有感覺,手機裡面如果一個任務超過 1 安培,手機其實是非常容易著火燒起來的。單任務超過 1 安培很危險,2 安培幹掉 1/5 的上限。人工智慧在計算機視覺裡面啟動人臉識別、性別識別,一系列任務都搞的話,能源的消耗也是不可接受的。我們希望在實現一個任務時,任何一個單位時延都在百毫秒以下、40 毫安以下。這也是專用手機 AI 晶元追求的技術指標。

我們其實是有約束的,AI 並不是模型越複雜越好,而是在一定情況下,一定考慮成本。我來了產品線之後,真正非常非常重視的是,在雲端不是不能跑,而是跑了用不起來,那麼做這個技術有什麼用?在做今年的整個產品交付時,我面臨著很大的壓力,正好借這個機會跟大家分享一下。實實在在的指標是可以牽引著人們繼續往下一代走,技術上可行了,就需要再多考慮一步,需要在面臨場景的複雜度和工程約束時也能做到。這樣,我們才認為這個 AI 技術能真正走到產業里來,確實解決了用戶痛點的問題。

第三點,深度學習。昨天看微軟的劉鐵岩在知乎上寫了很長的貼子講,人工智慧到了哪兒?他提出一個很好玩的概念:調參黑科技。

「華為張寶峰」AI 嚇尿指數與終端智慧化未來的三大痛點(PPT)

現在面試很多學生時,會問他做了什麼,用深度學習模型做了多少層的網路,做了多寬的參數選擇,用了哪些比較流行的各種各樣的層,有點像堆積木。

我不否認這代技術很有用,深度學習客觀來講解決了很多功能上很難解決的問題,包括語音識別還有圖像分類。但是這些東西是不是夠?既然作為 AI 領域裡面研究的先鋒或者所謂先行者的話,大家還要考慮一下這個東西夠還是不夠的問題。

理論上來講,深度學習的模型確實應該有最強的分析能力,但是深度學習是不是代表著只停留在這樣的應用就夠了?從產業應用角度,我們確實沒有時間去打開看每一層裡面有沒有優化的空間,以及引入新的人腦科學的東西來去改進所有層的設計。光去搞調參黑科技是不太夠的。基於大數據提取出來的問題,沒有當時的特定情況,或者沒有高頻次反應,在現在的訓練模型裡面很容易把這種信息忽略掉,這意味著理論上來講有一種 case 肯定會失效,意味著人工智慧很多決策系統裡面存在不可承受的風險。如何解決在最不可預測情況下保證模型不出災難性後果的問題,這是非常值得鼓勵的研究。

此外,不排除在工程實踐裡面繼續做寬度、深度、廣度、變換去解決實際問題,搞調參解決實際問題。如果有時間真正去攻關的話,這類技術的極限在哪裡?是不是在產業化應用裡面更好?模型可解釋性,無外乎三種:樹狀、回歸、網狀。其實數量模型做完非常容易解釋,例如:針對 30 歲的男性應該推薦某個商品,只要做出這個數量模型告訴大家為什麼當時做了這個決策以及給了這個推薦就可以了。網路模型沒有一個人能講清楚到底為什麼,反正能用,效果好壞能測出來,為什麼從來不知道,這是這代技術的挑戰和壓力。我們非常希望得到可解釋性的東西,包括有了 attention 之後,我們做非常複雜的網路意味著剛才提到的功率、內存所有的壓力都不太現實。如果我們能夠真正去理解這個模型,就可以做選擇、做壓縮,做裁剪。大家還是想想,既然做這種方向的研究,一定真正深下去、廣下去。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

破譯大腦識別人臉原理:人臉識別判斷人貧富程度,準確率53%
華為張寶峰:AI 嚇尿指數與終端智慧化未來的三大痛點
LinkedIn發布全球AI領域人才報告,揭全球AI人才圖譜
百度阿波羅正式開源,全資收購語音公司KITT|百度AI開發者大會

TAG:新智元 |

您可能感興趣

三星將推首款AI晶元NPU,性能超華為蘋果,智能終端AI芯大PK
聚焦 AI、5G、多智能終端前沿科技,OPPO 未來可期
為什麼說TCL智能終端將成AI×IoT市場的最大變數?
華為電視,補上IPTV的大屏終端缺口
ASPENCOR全球CEO峰會:利用面向終端節點設計的平台來簡化物聯網
睿思芯科推基於RISC-V的64位可編程終端AI晶元Pygmy
OPPO參展MWC19上海發兩大重磅技術和5G終端領先突破獎
華為DigiX AI應用創新大賽收官,「芯-端-雲」全棧加速推動終端生態發展
華碩送信仰到家 ROG AURA終端統一RGB光效
華為Mate X獲GSMA最佳新聯接移動終端獎
純手機終端廠商OPPO躋身全球PCT國際申請TOP20!
人工智慧引擎AI Engine:讓終端側的AI無處不在
甲骨文MICROS系統再曝漏洞 POS終端網路安全誰買單?
華為EMUI10官宣 UI大變樣或可實現跨終端共享 這五大亮點提前看
CLDMIND聯合AOC推出「AOC Mars雲終端一體機」
基於RISC-V的64位可編程終端AI晶元誕生
專註終端AI,耐能發布智能IoT專用AI晶元
三星、OPPO 等 8 大廠商搶發 5G 終端,贏家會是誰?
純手機終端廠商OPPO躋身全球PCT國際申請TOP20!用創新低調前行
手錶手機共享號碼 華為發布新款HUAWEI WATCH 2支持eSIM一號雙終端