當前位置:
首頁 > 最新 > 地平線智能解決方案與晶元事業部總經理張永謙:AI晶元是千萬行業智能化的發動機

地平線智能解決方案與晶元事業部總經理張永謙:AI晶元是千萬行業智能化的發動機

雷鋒網按:2018 全球人工智慧與機器人峰會(CCF-GAIR)在深圳召開,峰會由中國計算機學會(CCF)主辦,雷鋒網、香港中文大學(深圳)承辦,得到了深圳市政府的大力指導,是國內人工智慧和機器人學術界、工業界及投資界三大領域的頂級交流盛會,旨在打造國內人工智慧領域最具實力的跨界交流合作平台。

在CCF-GAIR 2018第三天的峰會現場,地平線智能解決方案與晶元事業部總經理,中國半導體行業資深商業專家張永謙在AI晶元專場分享了他的行業觀點和地平線公司的最新進展。

張永謙表示,AI目前趨勢分為三點:第一,計算從中央到邊緣;第二,智能終端成長潛力;第三,智能是個性化趨勢。基於這樣的判斷,張永謙認為,AI碎片化需求對創業公司有好處,傳統行業的大公司想用規模、人海戰術、資金實力、渠道能力在AI時代碾壓創新創業公司,幾乎不太可能。

此外,張永謙還介紹了目前地平線的第一代晶元和即將推出的第二代晶元,他表示,第一代晶元系列是成熟、量產化的系列解決方案,好處有兩點,一是快,一周集成, 三個月量產;二是高度平台化,能快速讓廣大行業客戶和產品客戶直接使用的方案。

旭日系列第二代晶元是基於伯努利架構,內核已經設計完畢。從現在開始到今年年底,地平線將著力做流片並同步適配演算法解決方案。

以下是張永謙在現場的演講,雷鋒網做了不改變原意的編輯整理。

張永謙:大家好,非常高興今天下午為大家介紹地平線的思考和落地的情況。

我今天的演講主題是「AI晶元,千萬行業智能化的發動機」,聽魏少軍所長和英特爾的同事說了非常多的渠道,今天我說得更加接地氣。作為創業AI公司,特別是在AI目前的階段,最重要的是AI能落地,今天主要談談我們AI落地的工作以及我們在這方面做的事情。 

我認為現在最大的趨勢是AI,分為幾點:

第一,計算從中央到邊緣。

在過去幾十年,從2000年開始,PC時代到智能手機,現在到Internet of Smart things,AI越來越跟著人走。雲端從過去的大計算率、大功耗完成任務,慢慢向端上擴展。我們認為人工智慧是端+雲,構成整個系統的平衡,讓整個功耗、性價比變得最優。端上的智能和雲上的智能都是需要的。地平線必須解決端上智能的問題。

第二,智能終端成長潛力。

中國可能是全球最大智能攝像頭生產國和使用地, 每年生產上億個智能攝像頭。考慮家用、嵌入式  攝像頭場景,每年會有10億個終端需要智能。目前可以看到終端的智能滲透 率只有1%,從現在開始,我覺得大概在兩三年內,大家會看到所有的攝像頭智能滲透率達到百分百。大家問產品視覺公司明年的產品會 不會涉及AI,偏人臉相關也是實際AI,答案是百分百。

我判斷2020年,所有跟智能攝像頭的產品百分百標配現在所謂的人工智慧,只是處理的強弱 。現在處理不到1%到兩三年後的百分百,可想而知  這個市場多麼大,這個窗口多麼大。行業中做晶元和AI的公司一定要抓住這個窗口,錯過這個窗口便難以有發展前途。

第三,智能是個性化趨勢。

這是百花齊放的情況,行業會重構。我們看到整個AI和互聯網一樣,它都是一個非常基本的底層技術,這個技術會重構整個行業,甚至重構整個社會 。互聯網在過去20年里是最火的行業,大家可以看到它顛覆  了多認知和行業,AI技術也是如此。AI技術對人產生很大的影響 ,它是更加本質的顛覆 。所有的AI是智能,它一定是個性化的,在後面很長一段時間內,大家對AI訴求非常個性化、碎片化的。

得到幾個推論:1,對創業公司有好處,傳統行業的大公司想用規模、人海戰術、資金實力、渠道能力在AI時代碾壓創新創業公司,幾乎不太可能。因為AI的需求非常碎片化;

2,AI是底層技術,行業要用AI就像行業要用互聯網,不是你坐在空調房敲幾行代碼就能重構的,必須是公司的業務體系架構、業務軟體甚至是整個行業都會被重構。AI對整個行業的顛覆只是剛剛開始,未來它會讓整個行業重構。過程中一 定會冒出非常多的黑馬,這對地平線來說是非常好的機會。

簡單介紹地平線目前做的事情,希望今天我們介紹的東西可以幫助合作夥伴和行業客戶。地平線成立於2015年7月,至今將近三年時間。正式員工500多人,60%以上是碩士和博士學位,是一家比較偏重底層AI技術的公司。

魏少軍所長談到軟體定義硬體,這是地平線成立以來一直秉承的思想,現在尚未達到強人工智慧的AI,軟體定義硬體。但我們確實往這個方向走,2015年我們提出地平線AI晶元想法,先由演算法解決實際問題,  根據演算法架構做晶元,這是軟體定義硬體。谷歌2016年推出TPU,用在雲端AI伺服器。魏少軍所長談到傳統處理器架構在AI時代一定會被淘汰,因為他們無法在端上使用。 

地平線公司成立三年時間,去年年底完成A+輪融資。這是我們推出的BPU,2015年7月首次提出,2017年首次發布BPU處理器及整體解決方案,歷時兩年多,過程非常辛苦。 

今天重點談談Edge AI在IoT領域側的應用 ,目前智能樓宇 、智慧社區、自動駕駛 、智能安防 、智慧商 業,Edge AI處理器是我們目標應用市場。晶元解決方案,我們希望完成智能開放的生態,生態的合作夥伴中有行業客戶,原來應用處理器的廠商可以和我們智能處理器匹配,做一個完整的智能解決方案,包括OEM、ODM和IDH。

現在包括智能安防、智慧社區、智慧零售、智能樓宇等各個方向,我們會提供一套完整的解決方案,包括底層晶元。重點我們有針對場景做的網路模型、上層簡單應用SDK,目的是希望幫助行業用戶快速使用AI。

核心點是我們希望AI變成平民化的東西,現在真正想把AI用起來,需要很大的演算法團隊,這是非常不親民 的。我們希望行業客戶、合作夥伴可以站在我們的肩膀之上,我們會針對重大場景,把AI軟體演算法結構固化到我們的晶元中。我們的合作夥伴可以直接使用我們整套解決方案,也可以利用他們的大數據在我們晶元架構中做訓練,訓練出他們自己的模型。他所需投入的資源、時間都會非常少,讓AI在行業中快速落地,這是我們公司的核心產品和市場思考、策略。

這同時會帶來其他的好處,很多晶元公司、演算法公司可以共同形成解決方案,我拜訪客戶時,客戶使用這個模式時比較糾結  。晶元公司和演算法公司,演算法和晶元不是最早期互相適配設計,中間會遇到各種各樣適配問題。晶元公司和演算法公司同時支持客戶做產品的公司,中間會遇到各種各樣的問題。如何定義是誰的問題,如何快速解決,如何分配利益,這都是比較麻煩的問題。我說得比較直接, 但確實是現實中大家面臨的問題。我們的客戶現在不需要有任何演算法團隊,使用我們整體解決方案,從第一次拿到我們的方案到推出他們智能化的產品只需要三個月。我們會提供一整套工具鏈,簡單易用,四步可以訓練出自己的模型 。

針對重要的場景,智慧社會、智慧商業場景、智能安防場景,我們提供基礎演算法模型和演算法模板。如果我們的客戶具有一定的演算法能力和大數據,可以快速開發出自有個性化的演算法模型,解決他面臨的豐富多彩的行業AI所需解決的問題。我們的交付層次不一 樣,不管你是怎樣的行業客戶和合作夥伴,都可以使用我們東西,快速完成AI落地。 

這是訓練模型的流程,整個訓練工具,UI做得非常友好,我們有一個非常好的界面,用戶可以快速簡單的使用它。簡單介紹旭日X系列,第一代、第二代和第三代的整體規劃,以及我們所需要解決的問題。

旭日系列有三代體系架構,高斯架構、伯努利架構和貝葉斯架構。高  斯架構,可以支持1080p的圖像數據處理, 檢測200個目 標,支持多達8個類別的目標檢測。具體看應用路標,第一代晶元系列是去年11月份布,目前基於第一代系列的晶元解決方案用戶,三季度在市場上會發布他們的產品。面向的應用主要是前端智能攝像頭、大規模人臉抓拍、高精度人臉識別、商業客流分析,這是主要的場景,下面我就這幾個場景為大家介紹我們目前的主要工作。

第一代晶元系列,我們和NVDIA TX1做對比,其功耗是我們的10倍,我們只需要2瓦,每幀處理30個目標,1080P/12fps,我們針對重大場景做優化,量身定做AI處理器,功耗和性價比做得非常好,快速為客戶提供完整的解決方案。

第一代晶元處理層次針對目標進行處理,現在看到在複雜的場景下,我們對車、人、路上標識牌做目標處理。實際落地的案例和解決方案:第一,大規模 、全場景人臉抓拍,主要面對智慧城市和智慧商業兩個場景。這是在北京故宮門檻,現在國內公安要做開放式場景布控,在廣場、車站、碼頭、樓宇和園區里,上下班、吃飯、高峰期都會面臨大規模人流,這時候布控需要很大的挑戰。

現在整體抓拍解決方案,從人臉檢測 、跟蹤、優選、去重等一系列做了深度的優化,加上年齡和屬性,可以很好的應對這種場景。即便是人臉抓拍這個小事情,行業內的人知道這非常不容易。除了要在非常複雜的情況下,把最好的人臉抓出來,最大的挑戰是光線,有逆光、低照、側臉,地平線整體解決方案經過非常多實際場景中做的經驗,不停的迭代優化。

我們拿到採用旭日第一代晶元人臉抓拍解決方案的相機,我們選擇業界一款採用TX1的人臉識別相機做對比。我們列出正常光線、晚上弱光、陰陽臉、逆光、弱光+複雜光線、正常光線+密集通道等,人臉抓拍是重要指標,我們的抓拍率和TX1在同一水平。在高峰期吃飯 時,人數一旦上來,我們仍然保持很高的抓拍率,TX1性能開始下降,出現誤抓和漏抓。我們可以讓這個解決方案做得更實用 、更好。現在我們的人臉抓拍解決方案做得非常成熟,目前市場上有十幾家客戶都在使用我們的解決方案,下個月可以推出產品。 

第二,前端、高性能人臉識別,大家知道最早由公安使用,接下來向民用滲透。公安行業更多的需要前端抓拍、後端  識別,主要由於犯罪庫比較大, 監察庫至少30萬,大家知道日常生活中,尤其是民用場景,我們的前端可以把識別小庫做好,高性價比和低功耗方案非常實用,適用於城市安防、智慧社區、智能樓宇和智慧商業,我們已經開始在市場上做推廣。 

這是我們在辦公室錄的視頻錄像,現在性能在1080P30幀處理的情況下,我們準確率高於95%。這是門禁級別,不是簡單的布控,用在用戶體驗最苛刻的場景中。 

第三,商業客流分析解決方案,可以廣泛應用在商業地產、零售門店和智能貨櫃 。由於新零售比較火,我們希望通過AI解決方案,讓線下商業場景數字化,讓行業客戶對它進行數字化管理和運營,對人、貨、場進行分析。除了人臉識別、屬性、客流統計以及動線跟蹤,我們在第一代晶元上做的是單攝像頭。第二代晶元會做多攝像頭融合以及商品識別。 

現在第一代晶元系列是成熟、量產化的系列解決方案,我認為它帶來最大的好處,一是快,一周集成, 三個月量產;二是高度平台化的,它可以同時做人臉抓拍、識別、商業客流分析,如果你需求足夠大,可以拿我們的開發工具和你的數據做更加個性化的場景處理。我認為這個方案是目前情況下最接地氣,最能快速讓廣大行業客戶和產品客戶直接使用的方案。

旭日第二代晶元系列是基於伯努利架構,內核設計完畢。從現在開始到今年年底,一是做流片,二是同步適配演算法解決方案。當明年1月份和3月份,大家  拿到我們晶元時,會同時拿到我們整體基於演算法+AI的解決方案。這是4K乘2K的30fps處理,不僅可以做前端,還可以做邊緣計算產品。大庫容人臉識別,基於像素級語義、動作行為分析、多路視頻流結構化、全面升級、開放性做得更好。

第二代晶元是基於像素級的語義分割和理解,三維物體檢測,這個應用更加多樣化。我們跟NVDIA TX2做了分類任務比較,早期我們可以做到2倍,現在我們可以做到TX2的10倍,我們的功耗在2瓦左右。語義分割任務的性能,我們對標對象不是TX2,這種情況下我們的IoU對目標進行語義級、像素級分割時,分割區域和  原始區域的重合率。業界可以看論文,70%是業界比較好的水平,在這個水平之下可以做到每秒處理16幀,我們的功耗只有2瓦。這裡有很多好玩的應用 ,原來做智能家電的朋友說你的電視做熱劇 ,我能否把時尚時裝、包摳出來做檢測、識別、分類,實時推送到用戶終端中。基於第二代晶元的架構,做這件事非常有意思、非常好玩,把它變成現實。

第二代晶元幾個大方向:一是大庫容 ,在2瓦過程中做50萬人動態比對,公共安防行業以後不需要GPU伺服器,在實時布控場景中也不需要GPU伺服器。全國30萬的抓逃庫可以布置在2瓦多晶元中,可以做成攜帶型盒子,隨時隨地布控。智慧商業場景也是如此,現在很多智慧商業無法落地,你不可能把伺服器部署在一個門店中,從功耗、可部署性和成本上都無法接受。當我們推出第二代晶元時,這個問題迎刃而解,我們把它 做在小盒子里,做大規模VRP、黑名單、 白名單處理。 

二是複雜場景,視頻結構化,這個事情出來很久了,業界老大哥公司做智能安防,他們推出基於GPU服務做了很多,但至今沒有大規模商用,我認為性價比是很重要的原因。在推出第二代晶元解決方案時,可以把獵鷹、臉譜等伺服器上做好。

三是基於像素級的語義分割和理解,行為分析和多攝像頭融合。更多的用於安防、智慧社區、教育、智 慧零售、醫療等各個場所可以做越來越多有意思的AI應用,讓它真正落地。這是我們公司做的基於像素級 的Python功能。現在它在伺服器上,利用第二代晶元的架構進行模擬,等第二代晶元出來後,直接在2瓦的晶元上實現。

地平線的目標是通過AI晶元和核心演算法,打造一整套解決方案,幫助我們行業客戶。我們的行業客戶並不需要建立龐大的演算法團隊,甚至他們不需要有硬體團隊,現在有非常多的行業客戶,他們原來和硬體、行業設備不沾邊,他們做硬體也會跟我們交流,他們懂行業和需求,國內資源非常多,我們希望通過AI賦能行業,讓AI真正和行業結合,幫助大家解決一些問題。 

地平線,中國芯。AI的路剛剛開始,如果您是行業客戶,我們非常歡迎您跟我們交流,現在各行各業的客戶都來找我們。如果你是智能設備廠商 ,我們可以幫助您三個月達到智能設備量產, 投入的資源非常少,可能只需要一個硬體工程師和一個軟體工程師就夠了。如果您是AP、Sensor廠商 ,我們可以聯合打造解決方案。這是我的聯繫方式,我們是創業公司,如果大家有合作需求可以直接聯繫我。謝謝大家!


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

眼擎科技朱繼志:攻克視覺成像的山頭,做自動駕駛最清晰的「眼睛」
雖又擊敗了人類選手,但我們認為 OpenAI的5v5 DOTA AI 不過如此

TAG:雷鋒網 |