Gyrfalcon Technology入局AI晶元戰場,研發存儲計算融合一體的本地並行AI運算架構
2017年7月,Intel發布了基於Movidius技術的神經計算棒,售價79美元,可以接入多種設備,部署深度學習推理任務。半年之後,Laceli 人工智慧計算棒問世,根據官網參數,性能是Movidius神經計算棒的90倍, 售價僅為69美元。
推出這款產品的,正是矽谷的一家AI晶元初創公司Gyrfalcon Technology。在此之前,公司已推出「光矛處理器 Lightspeeur 2801S」,於2017年9月成功流片,基於自研的APiM架構,有28000個並行神經計算核,180mW功耗下基於VGG模型每秒處理圖片150張,適用於CNN、RNN等常見深度神經網路的模型訓練及推理。
Gyrfalcon Technology成立於2017年,公司成立時正式AI晶元備受關注之時。深度學習技術的成熟及應用,原有的晶元算力已經難以應對巨大的算力消耗。簡單來說,深度學習的過程可以抽象理解為利用大量標註的數據進行訓練,訓練出一個行之有效的模型,再將這一模型運用於新數據的推理。因為這一演算法是建立在多層大規模神經網路之上的,後者本質上是包含了矩陣乘積和卷積操作的大運算量函數,往往需要先定義一個包含回歸問題的方差、分類時的交叉熵的代價函數,再數據分批傳遞進網路,根據參數求導出代價函數值,從而更新整個網路模型。這通常意味著至少幾百萬次的相乘處理,計算量巨大。
有多年半導體行業經驗的董琪、楊林、林建國、Terry Torng也看中了其中的市場機遇,於2017年一起創業,在矽谷創辦了Gyrfalcon Technology,希望打造AI晶元。
2017年,團隊推出了第一款晶元,名為Lightspeeur光矛系列智能神經網路處理器。從官網公布的性能參數上看,這款產品採用了28nm製造工藝,片上集成高達28000個運算單元,單晶元峰值運算能力為5.6TOPS,效率能耗比達到9.3Tops/W,180mW功耗下基於VGG模型每秒處理圖片150張,支持 常見的多種網路模型,同時支持標準的開源框架,如 Caffe, TensorFlow和 MXNet,表現亮眼。
之所以能做到這一點,團隊分析主要是因為兩大創新。一是採用了不同於傳統處理器架構,而是採用了二維的矩陣晶元架構,第一代的晶元產品已經可以做到 168核X168個核的矩陣架構,相當於片上集成28000個運算單元。
傳統的處理器基本是馮諾依曼架構,如Intel X86 CPU,單點架構,基於指令集處理各種簡單或複雜的任務,;或是類似NVDIA GPU這樣的一維架構,可以做大量並行計算,適用圖形計算,計算單元大幅提高但總量依然受限,功耗很高。而基於Gyrfalcon Technology的二維矩陣式結構,單品可以輕易集成幾十到幾十萬計算單元,多單品之間還可隨意無縫互聯,非常適合不同場景下的AI計算。,為降低功耗和發熱,其時鐘設計可以很慢,但由於計算單元海量增加,晶元整體速度卻會遠遠超過其他傳統架構的處理器。目前,團隊已經為這一技術申請了專利。
二是自研了 APiM架構(存儲計算融合一體的本地並行AI運算),消除了數據搬運的環節,解決了數據搬運牆難題。AI演算法在晶元實現時遇到的核心問題不是計算資源而是存儲問題,強如GPU提供眾多的計算資源,但實際計算能力與計算資源大為降低,很多情況下晶元80%左右的功耗都用於了數據搬運上。
Gyrfalcon Technology的 APiM架構提升內存的地位,將數據和運算寫在了內存里,相當於減少了一半以上的能耗。團隊告訴36氪,近期他們在ARM的雲端AI伺服器測試時,節省了90%左右的電量。
Gyrfalcon Technology告訴36氪,之所以能做到上面的這些創新,與團隊成員的經歷、背景相關。首席科學家楊林博士畢業於復旦大學電子工程系,後獲清華大學無線電系碩士和美國加大伯克利電子工程系博士學位,研究領域為圖像處理、神經網路、圖像識別和深度學習晶元,擁有近30年通訊、數字電視、晶元設計工作經驗,他是細胞神經網路(CNN)和中國數字電視傳輸標準核心技術發明人,擁有CNN領域30多項中美專利。CEO董琪畢業於清華大學微電子專業,先後獲得學士和碩士學位,是圖像感測器專家,擁有20多年國際半導體開發與生產管理經驗,曾是美國OMINVISION公司初創管理團隊成員,先後擔任技術開發副總裁和市場拓展副總裁。
另一方面,要實現這樣的創新,還需要更多底層技術的支持。比如,採用APiM的架構,也意味著對內存的要求提升,但目前市面上的DRAM、RRAM、Flash等存儲元器件,雖然技術成熟,但各自都存在某種使用上的缺欠,如漏電、功耗大、性能表現隨環境變化不穩定等等,,需要在材料方面創新。團隊中的資深技術副總裁Terry Torng,是明尼蘇達大學材料工程系博士,有近30年磁性記憶、磁性材料、高溫超導、微電子機械系統和感測器研發經驗,是高溫超導YBaCuO、93K發明人之一,帶領團隊研發了適用於AI晶元的新材料。
Gyrfalcon Technology的產品,目前可以適用於深度學習的訓練、推理環節,同時可以適用於雲端和終端。團隊分析,推理環節會是未來AI晶元的重要應用場景,而在雲端團隊很難撼動NVIDIA的優勢,因此主要聚焦終端的推理環節。
目前的產品主要包括單晶元、計算棒、板卡等多種形態,適用於移動邊緣計算、智能監控、智能玩具、智能家居、VR AR、機器人、自動駕駛等。根據此前騰訊科技的採訪,公司目前已經與一家自動駕駛公司啟動無人駕駛深度學習的產品合作,與韓國手機品牌開始AI手機方案合作、與日本知名企業合作專用AI伺服器、與中國製造業知名企業聯合啟動AI工業智能自動化項目、以及與國內安防企業籌劃真正具備本地AI識別能力的攝像頭等等。
總裁林建國告訴36氪,搭載Gyrfalcon Technology晶元的手機將於今年7月左右正式推出,晶元將主要用於支持一款圖像相關的應用。第二代產品疊加了新材料內存技術,在能耗、存儲能力上將實現量級提升,預計於2018年第四季度推出。
現階段,Gyrfalcon Technology組建了40人左右的團隊。除董琪、楊林、Terry Torng有半導體行業的技術、研發背景外,軟體部總裁張文涵是清華大學電子工程系博士,有20多年圖像視頻信號處理研發經驗,專註於計算機視覺及深度學習及其ASIC晶元架構,曾先後任職於意法半導體、Genesis Microchip、凌訊科技、Motorola 擔任高級技術及管理職位。
此外,總裁林建國畢業於清華大學經濟管理學院,後在美國南加州大學取得MBA學位,有30年通訊、IT、互聯網等高科技行業國內國際創業以及企業管理和運營經驗,曾在世界500強企業分別擔任北美戰略總監、全球業務總經理、美國公司總裁等職務。 市場付總裁雷兵曾在Syncomm、C2 Microsystems、ArcSoft、Electronic Business等多家晶元、電子類公司擔任CEO、全球營銷及商務拓展副總裁等職務,在對專業技術進行市場化、全球戰略合作方面有經驗。
至目前為止,公司已經完成來自中、日、韓的兩輪融資,中國上市公司華西股份有參投。團隊透露,公司2018年將有望實現盈虧平衡。
※平安訊科戎國強:「通信+金融」的模式使用戶的行為產生商業價值
※新金融:趣店式故事沒了,但有技術、出海和區塊鏈
TAG:36氪 |