當前位置:
首頁 > 科技 > 曠視王珏:前Adobe首席科學家,手握64項專利,曾助力拿下奧斯卡科學技術獎

曠視王珏:前Adobe首席科學家,手握64項專利,曾助力拿下奧斯卡科學技術獎

新智元原創

編輯:金磊、張佳

【新智元導讀】他,是前Adobe歷史上升職最快的首席科學家;他,同時在三大頂會發表過65篇學術論文、手裡帶過31位博士實習生、獲得了64項美國專利; 他,因與孫劍一「面」之緣加入曠視,堪稱脾氣最好的Leader、曠廠「人緣王」,「大尺度」科幻電影愛好者,曾助力拿下奧斯卡科學技術獎;他,正帶領一支全球團隊,締造AI影像之王;他,就是曠視美國研究院負責人(MEGVII Research US)——王珏。

提到曠視,除了孫劍,你還應該知道王珏。

或許,這個名字你不是很熟悉,沒關係,這很正常,畢竟大牛都是非常低調的。

然而,正是這樣低調的人物,曾同時在計算機視覺、計算機圖形學、人機交互三大領域最高級別會議和期刊發表65篇學術論文。

也曾在9年時間裡手把手帶領過31位博士實習生,獲得了64項美國專利,實現了13項重要技術的研發和產品轉換。

還曾是Adobe Research歷史上升職最快的首席科學家之一,提出的技術做成產品後,曾拿下奧斯卡科學技術獎。

如今,他轉戰曠視,率領一支全球團隊,正把深度學習 計算攝影推向極致。

他就是曠視AI影像之王的締造者——王珏。

師出名門的清華學霸,助力拿下奧斯卡科學技術獎

項目完成前,只吃雞肉炒飯

哪有什麼所謂的天才,還不都是孤獨地翻山越嶺。這句話用在王珏身上再合適不過了。

2003年,從清華念完本科和碩士的王珏,前往美國華盛頓大學電子工程系攻讀博士學位。

在此期間,「兩點一線」是他的常態。正如王珏自己所述:「我在做研究的過程中,一旦進入狀態,就不想打斷它。

這也正是為什麼連聖誕節期間,他也會開著車到學校泡在實驗室里的原因,也造就了王珏每年發表2篇頂會論文,3年得到導師畢業許可的「神話」。

而他在剛剛工作接觸項目時,還是會保持這種習慣——項目完成前,只吃雞肉炒飯

「若是每天想著去哪兒吃,吃什麼,非常麻煩。而當時公司附近剛好有一家不錯的雞肉炒飯,於是我們默認都去那裡解決吃飯問題。」

除了「嫌麻煩」,王珏另一個如此廢寢忘食的原因是他很珍惜這種狀態,就彷彿身處於科研的高峰體驗,靜待「突破」孕育而生。

求學期間獲點撥,助力拿下奧斯卡科學技術獎

除了自身的努力之外,來自「外界」的點撥與啟發也非常重要

王珏讀博士期間與多位名師有過深入的合作,分別是李衍達院士、微軟亞洲研究院的徐迎慶、王堅和沈向洋博士,以及計算機圖形學泰斗級人物Michael Cohen。

在李衍達院士的實驗室中,王珏主要輔佐醫學圖像處理方面的工作,在與微軟亞洲研究院的眾多大牛的合作中,王珏主要負責數字墨水和卡通、交互圖像視頻處理等工作。

這讓王珏一開始做研究便跨越了多個領域,培養出了寬闊的視野,為後來的工作不論在技術還是思想層面,都奠定了一定的基礎。正如王珏所說:

「像徐老師,他不僅擅長圖形學和計算機視覺,在動畫等領域也比較擅長;王堅老師是心理學博士出身,但在人機交互方面的工作也是十分出色。因此他們在做工作的時候,思想、視野都是比較開闊的。」

也正是這種長期不懈的堅持,王珏博士畢業加入Adobe Research的幾年期間,不斷取得突破,創造了碩果累累的業績。

而在發表的眾多論文中,讓王珏印象最為深刻的是2007年發表在SIGGRAPH的一篇題為《Soft Scissors: An Interactive Tool for Realtime High Quality Matting》的文章。

論文地址:http://www.juew.org/publication/softscissors-SIG07.pdf

在這篇文章中,王珏提出一種用於實時提取前景蒙版(alpha matte)的互動式工具——Soft Scissors,它是一種新的實時在線matting演算法,可以在複雜的前景對象(如毛茸茸的動物)中提取高質量的蒙版。

系統流程圖

甚至可以實時調整畫筆的寬度和邊界條件。在高質量圖像matting和合成任務中,Soft Scissors是第一個可以做到又快又準確的互動式工具將一系列的演算法創新融入到一個小小的筆刷之中

這篇論文雖然很較短,只有6頁,但卻是最能體現王珏論文風格的一篇——注重實用性

在此之前,大家在這個領域所做的工作更側重於數學層面上的建模與優化,而王珏是從用戶的角度出發,打造一個好用的實時系統,將複雜的演算法融入到簡單、流暢的交互過程當中。

也正是基於「王珏特色」的研究工作,使得像美國好萊塢的影像特效公司Digital Film Tools買下了技術版權並做成了產品。而就在今年,這家公司憑藉著該技術,獲得了奧斯卡科學技術獎

回首狂掃頂會論文的這些年,王珏總結其修鍊之路的經驗為:

選擇自己擅長的工作,認清自己的優、劣勢;

文章立意要新穎,若是啟發性不夠或者較為雷同,完成論文會較為困難;

為自己尋找思維開闊的導師。

從美國頂級公司到國內創業公司,「一碗面」引發的人才遷移

身處Adobe九載,一「面」之緣加入曠視

在學術上屢獲佳績的王珏在工作上也是一把好手。王珏曾在Adobe Research任職長達九年,並取得了非常不錯的成績。但他加入曠視,卻源於和孫劍的一「面」之緣。

那時,王珏恰好和孫劍在西雅圖,兩人相約一起吃飯,聊的很投機,一碗面的功夫,王珏就有了加入曠視的打算。

告別Adobe時,王珏用「專利石」拼了自己的名字

那麼最終選擇曠視的原因是什麼呢?王珏這樣解釋:

「主要是三個方面的原因。

一是和曠視有天然的親近感。曠視出自清華姚班,企業文化中有清華行勝於言,腳踏實地的價值觀。對於作為清華校友的我來講,有著天然的熟悉感。

二是孫劍博士的誠意邀請。我和孫劍博士認識並同行多年,彼此都比較熟悉,他不遠萬里到西雅圖來邀請我,我內心是無法拒絕的。

三是機遇。中國目前人工智慧研究的環境,從數據規模到商業機會都比美國要好,但是在人才儲備上仍然不佔優勢。能夠幫助中國人工智慧公司,特別是初創公司更進一步,在美國吸引頂尖人才為我所用,對中國高科技發展是一件里程碑性質的事情。這樣的機會在人生中並不多見,碰到了就應該抓住」。

於是,2017年4月,王珏加入曠視,與孫劍負責的中國研究院遙相呼應。

曠視,效率最高的公司

加入曠視兩年後,王珏步入了科研的快車道。與偏向於溫室的Adobe不同,作為一家創業公司,曠視的節奏是很快的,需要有短時間內攻克難關的能力。

王珏在Adobe做的第一個項目是關於視頻裡面交互物體的分割,前前後後3年時間產品才發布,而同樣難度、甚至更高難度的項目,通過團隊協作,曠視4-6個月左右就能落地。

用王珏自己的話講:曠視是他見過效率最高的公司

王珏(左二)參加2018曠視北京年會

曠視之所以能夠如此高效的運作與幾個地方默契配合分不開。曠視在北京、上海、南京、成都設有研究院,如此一來,項目推進就可以做到24小時不間斷,國內休息,國外接著干,再加上團隊的默契配合,才會有如此高的效率。

為什麼最近幾年大家覺得蘋果的創新速度變慢了?王珏認為可能是因為過於溫室、壓力小,所以腳步放慢了。對於趕超,王珏很有信心

兩年鑄一劍,打造國際頂尖AI水平團隊

曠廠「人緣王」,關鍵時刻沖在第一線

工作中的王珏是怎樣的呢?

Leader一般分兩類,一類是強硬派,一類是溫和派,王珏顯然是後者,甚至還被譽為「曠視最和藹可親的Leader」,曠廠的「人緣王」。

慢性子的王珏喜歡先想清楚再決策,深知生氣並不解決問題,作為Leader,他追求的是慢中求快,高效而平靜是他最喜歡的工作狀態。

王珏最喜歡的一個電影場景就是《指環王》中希優頓衝鋒陷陣,帶領士兵奮勇殺敵。在工作上,王珏對自己的要求也是如此,關鍵時刻沖在第一線。不光寫代碼、搞演算法,包括數據採集有時也會親力親為、通宵作業。

《指環王》劇照希優頓王(左一)

生活中的王珏不僅沒有領導架子,還非常關心同事。同事遇到難處,他都會儘力幫忙。之前同事買房,資金周轉不開,多會找王珏借錢,獲得幫助。有這樣的Leader,員工更是無後顧之憂,工作起來幹勁十足。

超強戰鬥力,打造國際頂尖AI團隊

影像之王,這是曠視CEO印奇下達的一道「指令」。兩年以來,王珏團隊挺進目標已取得赫赫戰績。這主要歸功於4個方面:

曠視原創自研的底層科研利器Brain 的有力支撐;

從問題和需求出發,推出一系列高水準論文,包括CVPR Oral在內;

AI技術覆蓋國內一線主流手機廠商,打造明星手機技術,比如OPPO Reno 夜拍超清畫質;

團隊衝鋒陷陣,與國內打配合,24小時不間斷推進項目。

王珏團隊成立以來不斷在壯大,而目前發展的狀況,用王珏的話就是:「非常滿意,層次豐富。

王珏團隊成員

目前王珏團隊成員主要專攻如下三個方面:深度學習、傳統計算機視覺/計算機圖形學、計算攝影

兩年前,王珏在接受新智元採訪時提到:「不追求將招聘重心放在頂級專家上,對於初創公司來講,戰鬥力決定一切。」從目前成員構成來看,也的確如此。

正是如此小而精的團隊,在今年CVPR 2019中就入圍兩篇論文,其中一篇為Oral:

論文地址:https://arxiv.org/abs/1901.00680v1

在這項研究中,曠視研究院首次提出了名為GeoNet的全新深度學習網路,可以建模點雲所潛在表徵的網格曲面特徵。

並在點雲上採樣、法向量估計、網格重建及非剛性形狀分類等多項經典任務中取得了最優結果。

而在另一篇工作中,王珏團隊提出了GIF2Video的方法,解決了長期以來GIF動圖顏色分層、模糊不清的困擾。

論文地址:https://arxiv.org/pdf/1901.02840.pdf

在CVPR 2019會議期間,王珏團隊在做展示時,蘋果、三星、谷歌等大廠的研究人員也會前來交流,並對其工作表示了高度的認可。

不僅是在科研方面,在將技術轉化為應用落地方面也是較為成功的。正如王珏所介紹:「我們給各個手機廠商提供了不少非常原創的技術,現在我們的客戶口碑是非常好的。

比如,曠視的raw域超畫質技術,將最好的深度去噪演算法和最優的傳統演算法結合起來,不僅在OPPO Reno手機上率先落地,更是受邀在高通和MTK的展會上進行了多次技術展示。

除此之外,曠視研發的超清夜景人像,大光比人像HDR以及人像AI微整形等多項技術已經廣泛應用於國內主流手機產品中。

其中,大光比人像HDR演算法還流傳為曠視的一段佳話。有一次,團隊某個項目擱淺一周沒用進展。當時王珏隨時隨刻都在思考這個問題,終於靈感在機場降臨——他當場在候機室寫出了正確解決問題的大光比人像HDR演算法。由於誕生在機場,這一演算法又順理成章地被稱為「機場演算法」。

曠視在CVPR2019上展示的超畫質技術

而在此「榮耀」的背後,王珏團隊也是付出了異於常人的努力。

去年7-9月份,團隊所面臨的項目挑戰可謂是極其艱難,團隊成員紛紛「衝鋒陷陣」,幾位同事甚至直接住在了公司。

加之與曠視國內研究院的協戰,整個曠視團隊相當於每天24小時不停奮戰,最後終於攻克難關,取得勝利。

帶領團隊向前走,正是王珏所最為驕傲且認為值當的事情。

「大尺度」電影愛好者還有些話要送給後來者

工作之餘,王珏是一名「大尺度」科幻電影愛好者。這裡的「大」尺度是「宏大」的大,王珏喜歡通過看宏大的、宇宙尺度的科幻片解壓。他對科幻電影的喜愛可以用「狂熱」來形容。

王珏與《星球大戰》角色楚巴卡合影

《流浪地球》在國內上映的時候,王珏興奮得不得了,身在異國的他按耐不住內心的激動,給國內的朋友們買票替他去支持國產科幻片。後來美國上映了,王珏馬上去電影院看。

而王珏的這一愛好也許與他的科研也是」一脈相承「。AI技術的高速發展,打造的正是像科幻大片里超未來的世界。而王珏所做的工作,可以說是在實現著他的」夢想「。

最後,王珏將自己摸爬滾打這麼多年的經驗總結成兩點送給後來者:

1、要深入到問題的本質

希望大家能夠沉下心來,在學習新技術的同時,也去翻翻老的、經典的教科書,裡面很多知識對以後的工作會非常有幫助。

2、做好當前這件事

未來具有高度的不確定性,有時候很難進行長遠規劃,但想要一個比較理想的契機,必須要做好當前這件事情,未來才會有更寬闊的空間。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

與清華聯手勇闖機器人世界盃!這家AI獨角獸實現技術「進球」
一個晶元隨意組合?英偉達將深度學習推向極致

TAG:新智元 |