寒武紀科技陳天石:在AI「石器」時代保留火種
有一句話形容現在的人工智慧特別合適:「我們往往高估了目前,而低估了未來」。如果要以其提出到現在60餘年為一個周期來看,它真正席捲人類社會,才剛剛開始。
從這樣的歷史長河來看、從通用人工智慧的未來回溯看,這個時代佔據舞台中央的這些開拓者,都是手握著「深度學習」、「神經網路」等最原始的工具,在這塊荒野上蹣跚前行。走在尋找人工智慧基礎工具這條路上,陳天石不比其他人多什麼先決條件。
幸運的是,從他創造的石器中,人們逐漸發現並保留了火種。
寒武紀,這家背靠中科院計算所的創業公司剛亮相市場,就踏入了「獨角獸」領域。
打磨「石器」
AI是一場革命。它和互聯網一樣,會席捲一切,會從無到有、再從有到無(無處不在)。普通人甚至不需要前行,它會主動過來擁抱你,甚至裹挾你。用羅振宇的話說:「你不必著急出發,因為你終將被抵達」。
在這場基礎設施重新定義的革命中,陳天石無疑是一個提前出發者。16歲考入中國科學技術大學少年班;2014年論文在美國召開的國際頂級學術會議上獲得最佳論文獎;創辦的公司寒武紀科技,A輪估值超過10億美元,成為全球首個人工智慧晶元「獨角獸」、全球最大的AI晶元初創公司。
基於深度學習這一底層演算法,計算機視覺、語音識別、自然語言處理、音頻識別與生物信息學等領域取得了長足的進展。但傳統的處理器例如CPU等,雖然是目前主流的AI計算平台,但是其基本框架結構畢竟不是為了AI所設計的,效率受到很多限制,包括GPU也有耗電量大等缺陷。
如果要用通用處理器搭建一個人腦規模突觸的神經網路,可能需要建一個電站來給它供電。阿爾法狗剛亮相時,下一盤棋動用了1000個CPU和200個GPU,每分鐘的電費就高達300美元,而網路規模只有人腦的千分之一。
陳天石認為,理想中的AI晶元應當是一種新型的處理器,能具有廣闊的應用面(包括語音、語義、圖像、視頻、自然語言多模態處理能力),同時具備遠超CPU和GPU的效率。要想達到這一目標,必須要有一套新的AI指令集,利用指令進行靈活處理,才有可能在AI晶元上把各種演算法應用都能支持得又快又好。
打個簡單的比方,把摩托車(PC、手機等)的發動機(CPU)裝到了汽車(深度學習平台)上,汽車自然開不快;現在,需要為汽車專門設計一款發動機(深度學習專用處理器)。
「DianNao」這一深度學習處理器架構,平均模擬性能超過主流CPU核的100倍,但是面積和功耗僅為1/10,效能提升可達三個數量級。2014年,他和哥哥陳雲霽以及法國信息技術研究院(Inria)的Olivier Temam教授合作的這篇論文,成為頂尖國際會議的最佳論文。
2014年-2016年間,他們倆和國際學術合作者一道幾乎橫掃了處理器架構學術圈,在頂級學術會議上教老外說中文的Diannao系列:Diannao(電腦)、DaDiannao(大電腦)、PuDiannao(普電腦)、ShiDiannao(視電腦)、Cambricon(寒武紀指令集)等一系列創新,針對不同的目的,將目前深度學習的效率提高數百倍。
有院士這樣分析,「寒武紀」在深度學習處理器指令集上的開創性進展,為我國佔據智能產業生態的領導性地位提供了技術支撐。自2014年中科院計算所和Inria聯合團隊提出首個深度學習處理器架構DianNao之後,深度學習處理器已經成為計算機體系結構國際會議ISCA最關注的研究方向之一。ISCA 2016上有近1/6的論文引用「寒武紀」的工作來進行深度學習處理器探索。
「目前,像阿爾法狗這樣的軟體演算法是在GPU上執行的,將來如果使用了『寒武紀』處理器,深度學習(神經網路)的運算速度會得到明顯提升。」陳天石說。
他用「瑞士軍刀和菜刀」來比喻通用處理器和深度學習處理器的關係:瑞士軍刀雖然功能多,但是做菜的時候,還是菜刀更合適。在智能處理方面,「寒武紀」就是這把更合適的菜刀。
寒武紀指令集直接面對大規模神經元和突觸的處理,一條指令即可完成一組神經元的處理,並對神經元和突觸數據在晶元上的傳輸提供了一系列專門的支持。模擬實驗表明,採用寒武紀指令集的深度學習處理器相對於x86指令集的中央處理器有兩個數量級的性能提升。
如今,通過在計算機中模擬神經元和突觸的計算,寒武紀的AI晶元對信息進行智能處理,藉助專門設計的存儲結構和指令集,每秒可以處理160億個神經元和超過2萬億個突觸,功耗卻只有原來的十分之一,未來甚至有希望把類似阿爾法狗的系統裝進手機。
埋頭「重工業」
晶元是信息產業的「尖刀連」,更是「重工業」,其所需要的投入是巨大的,遠遠超過AI的其他領域。
2017年8月,寒武紀科技獲得了價值1億美元的A輪融資,該輪投資由國投創業領投,阿里巴巴創投、聯想創投、國科投資、中科圖靈、元禾原點(天使輪領投方)、涌鏵投資(天使輪投資方)聯合投資。
這家背靠中科院計算所的創業公司剛亮相,就進入市場,就踏入了「獨角獸」領域。
華為的旗艦手機Mate10採用了寒武紀1A處理器,這是寒武紀AI產業化的第一步。這款2016年發布的全球首款商用深度學習專用處理器IP,入選了第三屆世界互聯網大會評選的十五項「世界互聯網領先科技成果」。
它不僅具有完全自主知識產權,而且在計算機視覺、語音識別、自然語言處理等關鍵人工智慧任務上具備出類拔萃的通用性和效能比,達到了傳統的四核通用CPU25倍以上的性能和50倍以上的能效。
「我們的產品寒武紀1A處理器,可以跟蘋果產品一較高下,結果我們很輕鬆打贏了這場戰鬥。我們並不是靠著蠻力去堆運算器,而是依靠最先進的、稀疏化的技術,四兩撥千斤,讓華為Mate10的智能處理速度打敗了強大的蘋果iphoneX。」陳天石說。
在將AI普惠化這一終極方向的指引下,他制定了自己的小目標。「我們現在與國外同行都是在同一個起跑線上的,希望寒武紀能在3年後佔據中國高性能智能晶元市場30%的份額;在3年後,讓全球有10億台設備集成寒武紀處理器的智能終端。」
他給出了實現的路徑。關於寒武紀晶元的市場商業化推進:「一是終端,二是雲端。終端產品就是智能手機、智能眼鏡、無人機、自動駕駛汽車等,需要晶元去識別圖像、影音和文字。而在雲端,像科大訊飛、中科曙光等這樣知名的雲端客戶,都已經是寒武紀的客戶。」
為了這個小目標,他說自己「除了休息的時間,都在工作」,拼了命地往前跑。在智能整個行業裡面最上面是應用層,利用人臉識別、語義理解等,去系統集成自動駕駛、智能手機等產品。而「冰山」看不見的地方是技術層。
而晶元是技術層的「地基」。「晶元就是像建房子或者修路這樣的事,如果沒有房子沒有路事情沒辦法往後走,希望我們未來能夠繼續承擔好智能時代的基礎設施提供商的角色。」陳天石說。
技術一定會帶來人與人之間的鴻溝,而降低技術的門檻、創造儘可能的公平是消除這一鴻溝的幾乎唯一可行的途徑。
「從個人角度出發,我們主要從事人工智慧加速晶元的研發,可以讓開發者獲得更加廉價、高效的晶元,支持上層應用的開發。」陳天石說,只有整個計算系統更加廉價,才有希望推動人工智慧的普惠化。因此在底層,降低功耗、提高效率是關鍵。
至於上層應用,群眾的智慧是無窮的。陳天石很樂觀,他抱著樂見其成的態度來支持人工智慧的發展,相信會在基礎層之上,長出更多的應用。
保留「火種」
2017年底,一篇名為《晶元戰國時代》的稿件在AI界很火,文章里說,「據CB Insights估算,進入新興晶元初創公司投資總額從2015年的8億美元增長到了2017年的16億美元;創投庫里,AI晶元公司從零星幾家增長到20多家。光2017年下半年,台積電的生產線上就有超過30款AI晶元排隊等著流片。」
時也勢也。能不能到達終點,不僅取決於奔跑的速度,更取決於所在的賽道。
不只有初創公司在跑,實際上巨人們覺醒得比誰都快。就在前兩天,晶元巨頭英偉達在美國消費電子展召開發布會,宣布了一系列關於無人車機器學習晶元Xavier的。鑒於在AI晶元領域的表現,其股票2017年上漲接近100%,堪稱「年度最佳理財產品」。
更別說英特爾、谷歌、Facebook、微軟等巨頭也在為此傾盡全力。諮詢公司Tractica的預測數據顯示,到2025年,與人工智慧相關的深度學習晶元組市場收入,將由此前的5億美元飆升至122億美元的規模,複合年均增長率超過40%。
生死搏殺,千億市場在一戰勝負。
「晶元的成敗,除了本身的效率之外,生態是非常關鍵的環節。沒有配套的應用和軟體,很難在市場上獲得成功」。陳天石說,只要國產AI 指令集立住了,中國主導世界AI產業的機會可能就到來了。
在寒武紀科技的第一場發布會上,他用了很長的時間去介紹自己的合作夥伴。他說,過去我們國內企業起步晚,一直是國際生態的跟隨者。我們融入這個生態,享受這個紅利,但我們並不能有多大的力量去改變這個生態。但是在智能時代,大家都在同樣的起跑線上,要敢為天下先,敢於提出並共同構建全新的智能生態。「光有寒武紀是不夠的,我們大家需要共同在硬體的指令集和軟體的開發平台上下功夫,在端雲結合上下功夫,在商業協作上下功夫」。
2017年10月16日,陳天石發了一條朋友圈,「一事平生無齮(Yi)齕(He),但開風氣不為師」。這句出自龔自珍的詩詞,後來被很多教育界名士所引用。
事後他回想,這大概是因為他的執拗。18年前,陳天石考入中國科技大學,隨後師從陳國良院士和姚新教授,讀人工智慧方向的博士。將近20年,他只做這一件事,把最底層的生態基石也就是晶元要做好。「技術一定要是最好的。」
過去是,現在是,將來無論公司走到哪一步,技術永遠被擺在第一位。
(經濟參考報)
※慕課「走紅」 還須過深度融合這道坎兒
※多地啟動按病種收費 醫保改革漸入深水區
TAG:經濟參考報 |