當前位置:
首頁 > 科技 > 又有微軟AI科學家流向產業,小鵬汽車迎來視覺感知負責人郭彥東

又有微軟AI科學家流向產業,小鵬汽車迎來視覺感知負責人郭彥東

李根 發自 凹非寺

量子位 報道 | 公眾號 QbitAI

太陽底下無新事,趨勢變化不是無跡可尋。

一次次科技轉關大同小異,無非錢動人動,最終潮水洶湧成勢能。

2017年何小鵬由投資人親任董事長,小鵬汽車便開啟錢至人至加速度,上周又剛官宣一輪40億元新融資,整體估值超250億元。

同時,隱而未宣的是又有AI人才加盟。

這一次,微軟計算機視覺科學家郭彥東,從微軟總部而來,任職小鵬汽車AI產品部計算機視覺首席研究員。

郭彥東將承擔的,是小鵬智能車AI視覺及感知相關的研發到應用。

這位80後科學家拿什麼hold住?

小鵬汽車AI產品部計算機視覺首席研究員郭彥東

郭彥東其人

雖然年輕,但郭彥東卻是這波AI浪潮中最「生逢其時」的一代人。加入小鵬汽車前,郭彥東在AI及CV相關的研發已有14年之久。

郭彥東本科和碩士均學成於北京郵電大學,曾在湯姆森研究院(後更名為Technicolor)和中國移動任職,參與過中國第一代甚低碼率可視電話的研發,也是中國移動彩信,手機電視,手機閱讀等等企業標準/國家標準的制定者之一。

其後拿到普度大學全額獎學金赴美讀博,師從美國工程院院士Jan P. Allebach與Charles A. Bouman。博士期間多項視覺領域的研究成果作為關鍵技術被應用在GE、HP等公司。

從博士畢業起,他就成為微軟美國總部研究員,專註機器視覺和圖像處理技術,是微軟智能識別服務的關鍵貢獻者。

特別是2016年與2017年,郭彥東將大數據、知識圖譜,以及深度學習的方法有機融合在一起,並和同事一起發起組織了微軟百萬名人識別競賽MS-Celeb-1M——後來被業內稱為人臉識別「世界盃」,在業界影響巨大。

郭彥東學術論文列表節選

更關鍵的是,2016年開始,郭彥東領導了微軟互聯互通車項目的視覺感知部分,致力於將微軟的視覺技術推廣到汽車領域,主導研究開發了基於視覺的車內、車外感知功能。

也是如此專註的履歷,郭彥東成為何小鵬全球挖角之旅中的重要專家人選。

為何要挖CV科學家?

在小鵬汽車,郭彥東一樣名校博士、履歷閃光的人都被稱作專家。既是出於人才的尊重,也為體現產學研一提的決心——不再是科學家科研、工程師落地的二分法模式。

而在此體系中,視覺和感知,是小鵬汽車AI研發平台下一個極其重要的業務方向。

小鵬汽車從創立之初,就以「智能車」為目標,而視覺與感知是智能的基礎與前提。智能化就是真正的理解車外與車內的場景,

自動駕駛L0-L5

小鵬也對外多次介紹過,這將是一條從L2到L3,再最終邁入L4、L5的自動駕駛實現之路。

實際上,當前見怪不怪,有些輔助駕駛功能,作為獨立模塊,多可以有供應商提供了。

但這家造車新勢力寧願走得更難,希望自建AI視覺和感知研發,以此將AI用戶體驗與車輛安全熔於一爐,從而打造企業產品核心差異化。

郭彥東舉例說,如將智能感知與決策把獨立的輔助駕駛功能有機結合起來,才會打造出真正的智能車,才能夠提高用戶的體驗。

更具體而言,一方面是車外的一些感知,如天氣、場景、以及事件的識別和預測。

小鵬汽車G3車頂上的360°攝像頭

「一個司機在路上看到一輛校車停在路邊,車門打開了,他會知道可能有小朋友從車裡跑出來。但是什麼時候我們的輔助駕駛功能車,搭載了智能模塊以後也能做出類似的判斷呢?這才是我們樂於看到的事情。」

車外場景之外,車內的感知對用戶體驗也同等重要。

如乘客、司機的識別,通過面部狀態監控對注意力、情緒的識別,對安全和體驗都尤為關鍵。

在郭彥東看來,面部監控對於L2到L3的跨越非常關鍵。

L2級輔助駕駛,需要手不離方向盤,以保持對車控制;而L3則手可離方向盤,但是需要用戶隨時接管方向盤。讓用戶隨時能夠恢復接管的前提就是需要知道用戶的狀態,提醒用戶保持注意力集中。有統計數據表明,在輔助駕駛的情況下,用戶反而會傾向於降低關注度。

「如果在駕駛過程中,讓感測器實時感知,能夠更好理解司機狀態,不斷做出反饋,那L2到L3之間過渡的核心問題便能得到安全性高體驗性地解決。」

如此方案,聽起來容易理解,但做起來其實並不容易。

小鵬汽車內部,已形成三步走共識。

AI Car

智能車系統三步走

按照數據量的三階段:冷啟動,系統模型訓練,最後量產車場景迭代,將AI智能車系統分三步走。

第一步,無車/少車情況下,數據冷啟動。

郭彥東認為可以依靠4方面,1)互聯網大數據、2)模擬大數據、3)自有車隊或測試車隊大數據,4)中國真實用戶大數據。

這位曾經參與微軟Bing圖片搜索核心技術研發的科學家說,互聯網數據量非常之大,對早期演算法的演進意義重大。

但也不是「完美無瑕」,畢竟這部分數據可能跟無人駕駛、智能車需求的數據分布不盡一致,標註也存在困難,需要用遷移學習的方式將互聯網的結構化信息轉移轉換,賦能於車。

於是為了驗證遷移學習的效果,同時也得到更多,更真實的數據,也需要關注模擬大數據、自有車隊數據,以及用戶真實數據等其他3個渠道。

總之,數據是深度學習之關鍵,也是智能車系統模型優劣的關鍵。

數據經過冷啟動階段,接下來就是搭建AI平台,訓練深度學習模型

郭彥東強調,在智能車的場景中,往往最有價值的就是長尾(long-tail)數據。

即那些低頻場景下才能產生的數據,儘管長尾數據需要的種類、類別、數量都會非常多且有挑戰,但越多長尾數據收集,就越能讓智能車適應更多場景。

這也就要求需要有一個快速處理長尾數據能力的AI平台。業界也有很多相關的努力。

比如微軟的custom vision,郭彥東博士本人就曾參與該項目的核心研究工作,可以在樣本數很小的情況下,用非常短的時間,得到很準確的模型的。

雖然純互聯網系統平台與車用場景並不一致,技術上還有諸多挑戰,但郭彥東堅信能克服,並在量產車場景下實現更快,更精準,能夠處理長尾數據的智能閉環迭代。

作為整車廠,從無到有造車自然不易,但也是吸引郭彥東的核心「優勢」之一。

有了數據,有了AI模型訓練平台,還需要更多數據幫助迭代,而量產車正是最獨一無二的場景。

此前在Uber和特斯拉發展自動駕駛時,業內便對這種路線頗為看好,核心原因之一便是有時刻不停地真實場景下的量產車「幫助」數據迭代和模型迭代。

所以郭彥東博士認為,一旦小鵬量產車上路,雖有更大更多數據反饋方面的繁重工作,但每一次都會讓智能車系統更出色,迭代升級會更快,用戶的反饋也能幫助智能車各項功能的調校。

這讓AI視覺科學家們渴求。

更何況,比起在美國造車,中國有更廣闊的市場空間和更獨特的路況場景及駕駛行為。

回國造車

郭彥東坦承,回國參與一番事業,是每一個中國AI人才的夢想。

而且小鵬汽車所承載的市場機遇,前所未有。

有數據統計,美國汽車千人保有量是910輛,但中國千人只有154輛。

加之經濟發展勢頭,未來5-10年的增長機遇,空間和趨勢不言自明。

郭彥東說,想要做出更具影響力的產品,讓所學技術被最多人使用,就要跳上最富潛力和前景的航海船。

小鵬汽車,對他而言就是這艘AI大航海時代的船。

當然,郭彥東也心懷教育傳承之心,雖然他已同時是北京郵電大學和電子科技大學的兼職教授,但他希望能帶領更多年輕人躬行實踐,將所學化為所用。

他說在小鵬汽車還有一項重要使命——招募更多年輕有為的人才。

從業務劃分,他認為自然可以分出個車內智能車外環境感知關鍵視覺技術模塊開發模型優化與融合的招聘方向。

但更重要的是年輕幹勁足學習成長快,而且有自主自研的決心

郭彥東說,拿來改和用很簡單、堅持自研很難,但最難的路也最考驗基礎、最容易造就創新。

註:中美汽車保有量數據來源

【1】「Vehicle Statistics: Cars Per Capita」. Capitol Tires.

【2】「環境保護部發布《中國機動車環境管理年報(2017)》」. 中華人民共和國環境保護部. Retrieved 2017-11-01.

作者系網易新聞·網易號「各有態度」簽約作者

加入社群

量子位AI社群19群開始招募啦,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話界面回復關鍵字「交流群」,獲取入群方式;

此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。

進專業群請在量子位公眾號(QbitAI)對話界面回復關鍵字「專業群」,獲取入群方式。(專業群審核較嚴,敬請諒解)

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 量子位 的精彩文章:

谷歌AI繪製大腦神經地圖,開源代碼幫你理清混亂的腦迴路
2018北大AI公開課13期全乾貨盤點

TAG:量子位 |