中科院計算所陳雲霽:基礎研究需要興趣,更需要耐得住寂寞
雷鋒網 AI 科技評論按:自 14 歲進入中科大少年班開始,陳雲霽便展現了非凡的科研實力,25 歲時(2008 年)獲導師胡偉武欽點擔任 8 核龍芯 3 號的主架構師,也是在 25 歲這年他與主攻演算法的弟弟開始智能演算法和晶元設計的交叉研究,讓中國在智能時代來臨之際有可能實現智能晶元領域的「彎道超車」:目前國際智能晶元領域他引最多的兩篇論文(DianNao和DaDianNao)均來自陳雲霽團隊,而寒武紀深度學習處理器也入選了國際計算機學會通訊的研究熱點(每年評選十個,大陸為首次入選)。
作為當下人工智慧晶元領域備受矚目的科學家,陳雲霽參加了 CNCC 2018 的「CPU 及 xPU 晶元未來之路」論壇並發表演講,在會後的專訪中,陳雲霽與雷鋒網 AI 科技評論記者分享了自己近期的一些想法,當中包括中科院計算所的師門傳承關係、寒武紀的發展之路、接下來的研究方向以及對於基礎研究的感悟。(採訪:岑峰 ;整理:黃善清)
陳雲霽是中國科學院計算技術研究所研究員(正教授),國際首個深度學習專用處理器「寒武紀」的主設計師,研究領域包括微體系結構、並行計算、計算智能、視頻處理等。他在包括 ISCA、HPCA、MICRO、ASPLOS、ICSE、IJCAI、ISSCC 以及 8 種 IEEE/ACM Trans 在內的學術會議及期刊上發表論文近一百篇,申請發明專利近一百項,在 2015 年時入選《麻省理工科技評論》35 歲以下的全球最佳 35 名創新人士,同時也是首屆國家自然科學基金「優秀青年基金」以及首屆中組部「青年拔尖人才計劃」的入選者。
從曙光到寒武紀——一脈相承的「軟硬結合」
AI 科技評論:你現在做的寒武紀晶元是中科院計算所的項目,跟計算所的其他項目如曙光超算、龍芯之間有什麼樣的傳承關係或者演進過程呢?
陳雲霽:傳承關係很長。曙光董事長李國傑院士(也是中科院計算所前所長)80 年代在美國讀博那會開始,已經在做人工智慧與計算機體系結構的交叉研究,而且分別在這兩個領域的頂級會議上發表過文章。
AI 科技評論:當年李院士被稱為「Paper Machine」。
陳雲霽:我聽過這個傳說。當時李院士可能主要在做基礎研究,不像回國後可以把研究工作做成產業。後來李院士回國後,帶的第一個學生叫姚新,他也是我的弟弟陳天石的導師。李院士帶姚新做人工智慧演算法的時間複雜度分析,後來我的弟弟陳天石去念姚新老師和陳國良老師的研究生,第一個任務也是做人工智慧演算法的時間複雜度分析。
AI 科技評論:那是在什麼時候?
陳雲霽:2005 年,這一支的脈絡就這麼傳承了下來。至於另一支脈絡是在李院士擔任計算所所長時,領導了我的導師胡偉武做龍芯 CPU,我相當於從這一支脈絡傳承了下來。直到 08 年,這兩支脈絡才重新結合,重心放在人工智慧與機體結構的交叉研究上。
回過頭來看,計算所會做人工智慧晶元是有其必然性的,除了傳承的過程,還有一點是,上世紀 80、90 年代的國家科委(如今的科技部)成立了國家智能計算機研究開發中心,當時依託在我們的計算所,由李國傑院士(後來為孫凝暉老師)負責管理,這也就是說研究所早在 90 年代初、80 年代末便承擔了智能計算機的研發任務,雖然在過程中任務可能中斷過,但從某種意義上說也是研究所在人工智慧領域的任務循環。
AI 科技評論:從當年的智能計算機到當下的人工智慧晶元,你覺得兩者之間存在什麼樣的聯繫?
陳雲霽:我覺得更多是思想和工作方法上的傳承。從工作方法的角度來說,我們研究所的特點是無論做什麼都會有看得見摸得著的系統,而且這個成品往往是「軟硬結合」的。即使是現在,我們研究所出的研究依然保留著這個特色。
AI 科技評論:剛剛你提到姚新老師那支脈絡的研究更傾向於「軟」,而你這支脈絡的研究更傾向於「硬」,因此形成了「軟硬結合」的研究風格,這個風格一直延續到寒武紀神經智能晶元的開發上?
陳雲霽:實際過程可能要稍微複雜一些,我們是想把「軟」的人工智慧演算法與「硬」的晶元結合起來,所以一開始先用人工智慧演算法來指導晶元的設計,事成後,再反過來用晶元的設計思路來指導並完善人工智慧演算法,也就是我們的人工智慧晶元。
AI 科技評論:兩者在執行上有沒有時間分界點?
陳雲霽:這個沒有太明確的分界點,因為我們所做的實際上是將兩者進行捏合,肯定會有一方是主一方是從,我們顛過來倒過去的都嘗試過,可以確定的是我們一開始先利用演算法來做通用 CPU 的設計。
寒武紀的「破局」
AI 科技評論:人工智慧在 2008 年還屬於比較冷門的領域,當時你們怎麼會想到做人工智慧演算法與晶元方面的結合?
陳雲霽:主要是基於兩方面的考慮。從初心的角度來看,人工智慧在當時確實比較冷門,大家都覺得是一件離自身較遙遠的事情,但是對我們而言,它卻是計算機領域裡最具有吸引力的課題,如果我們今天要吸引一名小孩投身科學領域成為計算機科學家,那麼造出跟人一樣聰明的機器人對小孩來說絕對是個很有吸引力的課題,這也是我們的工作初心;從資源的角度來看,我跟弟弟陳天石擅長的領域正好比較互補,兩人又同時對彼此的工作比較認可,所以有進一步合作的意願,這是比較難得的,換一個人,如果在自身領域做得比較好的情況下,一般不會願意跨領域去冒險,尤其是在 2008 年人工智慧還比較冷門的時候。
AI 科技評論:寒武紀晶元第一次獲得大範圍關注應該是在 2014、2015 年左右。
陳雲霽:應該是在 2014 年的時候,當時我們獲得 ASPLOS 的最佳論文獎,這是亞洲地區第一次在計算機體系結構的頂級會議上獲獎。我們的工作在 2014 年以前的接受度其實並不高,跟現在的熱鬧相比,當時更多的是一種孤獨的感覺。
AI 科技評論:中國的計算機體系結構研究在 2014 年以前是什麼樣的?
陳雲霽:我們國家在 2014 年以前也有不少做得不錯的工作,但如果從實際造出機器來看,當時國內公認的機構有三家:計算所、江南所以及國防科大;如果從基礎研究的角度來看,清華、華工、哈工大、北航、中科大這些都做得很不錯。
AI 科技評論:國內的早期計算機體系結構研究未能形成突破的局限點是什麼?
陳雲霽:其實突破還是有很多的。只是回到通用 CPU 的問題上,畢竟美國已經做了將近 40、50 年,比如英特爾公司是在六幾年成立的,雖然一開始做的是存儲相關的晶元,但至今起碼也有 40 年的時間。要想在一個別人已經做了 40 年的領域上有所突破,難度還是比較大的,更多時候我們還得不停補短板。
AI 科技評論:寒武紀獲得阿里的投資後有什麼樣的變化?阿里提供了什麼樣的幫助?
陳雲霽:這塊我不是特別了解,因為這屬於寒武紀公司運營層面的事情。我每次都要一再跟人解釋,我其實只是計算所的一名研究員,並未參與寒武紀公司的運營決策,是一名不折不扣的三無人員——沒錢、沒股份、沒職位。但由於我是最早做這個研究的,因此很多人會誤以為我是寒武紀公司的創始人,這個說法並不準確,我只是寒武紀晶元研究的創始人,從公司層面來說,我連普通員工都不是。
AI 科技評論:如何看待計算所與寒武紀公司之間的關係?
陳雲霽:從某種意義上來說,計算所與寒武紀公司之間存在一種有一定耦合度但不完全一致的關係,因為計算所更擅長做從 0 到 1 的事情,但對於公司來說,從 1 到 10、到 100、到 1000、到 1 萬甚至到 1 億,才是它們更擅長的東西。計算所更偏重實現技術原理上的突破,而公司更偏重將產品與客戶需求進行結合,做出更具有市場價值的產品。
一個好的基礎研究者,一定是一個孤獨的人
AI 科技評論:近些年人工智慧領域有這麼一個現象,就是學界的基礎研究缺少來自工業界資源的支撐,導致研究不夠「接地氣」,因此不少學界研究人員選擇到工業界發展,您的身邊有出現類似的情況嗎?
陳雲霽:我的弟弟陳天石從某種意義上來說就是走的這個模式,更多地負責公司運營和產品打造層面的事情,而不是技術研究。但對我而言,我還是更願意留在研究所里繼續做研究,這兩者各有各的樂趣,我跟陳天石也有各自不同的興趣愛好。另外還有一點是,如果他做得足夠出彩,我可以為他感到驕傲,就不一定非得自己投身到這件事情上去。我覺得科學研究對我而言已足夠有挑戰性,也能給我帶來很多的成就感,所以我更願意繼續做這一塊事情。目前人工智慧領域的研究人員可以跟工業界快速進行切換,我覺得其實是一件好事,但肯定也要有一批人長期堅持做一些具有前瞻性的研究。
AI 科技評論:據了解,你在大學時期的興趣愛好比較廣泛,比如打遊戲,而且有報道說你曾經從遊戲中獲得關於人工智慧研究的靈感。
陳雲霽:遊戲本身確實給我的大學時代帶來很多樂趣,讓我打從心底認為計算機是個很有意思的東西,但如果說到具體的科研思路,更多還是從科學的實驗和冥想上獲得的。當然,如果有一天我們的研究能夠對遊戲的發展起到一定的作用,我覺得也挺好的,相當於將興趣和職業進行了結合,然而目前可能還沒做到。
AI 科技評論:很多人對計算機產生興趣,可能都是從遊戲開始。
陳雲霽:沒錯,而且人工智慧未來在遊戲上的應用也會比較廣,比如你在遊戲里缺少對手時,系統可以給你匹配一個虛擬主體,這個應用讓我覺得非常有意思。
AI 科技評論:學界也有很多論文在寫如何組織機器打遊戲。
陳雲霽:我看谷歌、Open AI、阿里包括中國科學院都做過相關研究,比如通過人工智慧的方法去玩星際爭霸、dota 之類的遊戲,長遠來看這是一項很重要的研究。從產業鏈的角度來說,這個技術相當於在遊戲世界創造了成千上萬的虛擬玩家,即使對用戶來說這些玩家可能 99% 都是假的,但是遊戲體驗還是變好了。
AI 科技評論:這一塊研究與您目前的研究在未來會有交叉嗎?
陳雲霽:有可能。一方面是希望通過我們的晶元為遊戲提供支撐,另一方面,我們也希望能夠研究一些新的人工智慧模式。這麼說吧,目前的人工智慧更多在做感知,主要想讓機器看得見、聽得懂,不過我覺得真正有意思的人工智慧,應該是機器自己能夠進行聯想和推理,這就屬於認知的層面。
AI 科技評論:剛才黃暢博士(地平線聯合創始人)也提到了,未來 60% 的人工智慧研發重點在推理。
陳雲霽:這很有可能。這一塊目前還不太成熟,我覺得研究人員有義務去做探索,至於那些已經成熟的東西,就交給工業界來做。目前人工智慧有一個著名的方向叫 Multi Agent(多智體),這個理論主要強調如何在很多虛擬智能體的情況下做交互共生,讓機器變得更聰明,這對遊戲的未來發展而言至關重要。
AI 科技評論:當人工智慧的發展從「感知」向「推理」轉變,對於計算機體系結構的研究來說會有什麼樣的變化?
陳雲霽:模式會變得很不一樣。我讀博期間做的很多工作其實都跟推理相關,按照傳統的說法,人工智慧可以分為三個流派:符號主義、行為主義和連接主義,最終可以讓大家深刻感知到「智能」的主要體現在認知層面,而認知層面的一些核心方法基本上都源自於符號主義,不過這一塊的研究目前算是處於停滯狀態。另外,演算法模式也會變得很不一樣,比如推理領域目前最核心的演算法叫 SAT(命題邏輯的可滿足性判定),也被稱為一個「NP 難」問題(指數時間複雜度問題),這說明目前最簡單的推理問題,我們要想解決都還有很長的路要走。最近的 10 年、20 年,符號主義推理流派的相關研究進展不是很大,這也提醒我們這些做基礎研究的人,要多多關注這塊內容。
AI 科技評論:應該如何做好基礎研究?
陳雲霽:我覺得如果要做一個好的基礎研究者,你一定是一個很孤獨的人。2008 年我們開始智能和晶元交叉研究時候,我們很孤獨。今天我們的論文現在被全世界上百個研究機構,包括哈佛、斯坦福、MIT、伯克利、英特爾、惠普、IBM 等,大規模的進行跟蹤和應用,甚至寫進了教科書里,有那麼多人在做相關的研究,我們可能已經不再感覺孤獨了,這也意味著我們應該將手頭上的事情交棒給企業去做,然後繼續去看一些比較新的東西。當然,深度學習處理器我已經做了這麼久,未來工程開發肯定還會繼續做,只是接下來基礎研究確實要把更多的目光放在一些新方向上。
雷鋒網 AI 科技評論
※商湯 37 篇論文入選 ECCV 2018,開源 mm-detection 檢測庫
※讓演算法解放演算法工程師——NAS 綜述
TAG:雷鋒網 |