當前位置:
首頁 > 新聞 > AI晶元的競爭將成為又一場馬拉松

AI晶元的競爭將成為又一場馬拉松

Esther| 撰文

多年來,半導體行業的競爭似乎塵埃落定了:英特爾公司幾乎擊敗了伺服器行業所有的RISC(精簡指令集演算法)處理器廠商,拯救了IBM的Power系列處理器。而在2013年,AMD經受了英特爾x86的一系列打壓無力還擊。NVIDIA(英偉達)作為GPU行業的後起之秀,曾在90年代打敗了許許多多的競爭者,而現在只剩下了AMD還能與之抗衡,也就是收購而來的ATI,其早前的市場份額號稱達到了NVIDIA的一半。

而在全新的移動市場中,彷彿講述了一個近乎壟斷的相似故事:英國ARM公司稱霸了移動晶元市場。在此期間,英特爾非常努力地開發Atom處理器,但是頻頻碰壁,最終於2015年放棄。

就這樣,一切都改變了,AMD作為x86強力的競爭者又重新浮出水面,後來FPGA(可編程門陣列技術,專門處理大數據等新型技術)處理器出現了。不過,晶元市場還是在人工智慧(AI)與機器學習(ML)的出現後,才出現了重大轉變。隨著這些新興科技的出現,一些令人意想不到廠商也推出了一批新的處理器,筆者在下方進行了整理。

英特爾通過在2016年收購深度學習公司Nervana Systems,而後又收購了一家計算機視覺晶元公司Movidius,開發圖像處理AI技術。

微軟正在為HoloLens的混合現實頭顯開發一款AI晶元,未來這款晶元可能應用與其他設備中。

谷歌為神經網路開發了一款AI晶元,名為張量處理單元(TPU),可供谷歌雲平台上的AI應用使用。

據報道,亞馬遜在為Alexa語音助手開發一款AI晶元。

蘋果在研發一款AI處理器,名為Neural Engine,將用於Siri和FaceID。

近日,ARM集團推出了兩款新處理器,ARM機器學習(ML)處理器和物體檢測(OD)處理器,都是專門用來識別圖像的。

2017年底,IBM公司開發了一款專門的AI處理器Power 9,並且授權NVIDIA的NVLink部門專門為AI和ML量產高速數據。

非傳統科技公司特斯拉都想加入競爭,CEO馬斯克在2017年底都證實前AMD和蘋果晶元的工程師,「晶元大神」Jim Keller將為特斯拉研發晶元。

谷歌TPU計算單元

微軟Hololens中HPU結構圖

Intel Movidius晶元場景描繪PPT

當然,這些只是宏觀的總結,並沒有算入各種初創公司。《紐約時報》估計專註開發AI晶元的創業公司(既不是軟體公司,也不是晶元公司)能有45家,而且數量還在增加。當然,這個數字並不完整,因為有些在中國的創業公司由政府投資,非常低調。

那麼問題來了,晶元製造業停滯不前這麼久之後,為什麼又火爆起來了?畢竟,大家都知道,NVIDIA公司的GPU是很優秀的人工智慧處理器,而且已經得到了廣泛應用。那為什麼現在需要更多開發更多不同的晶元呢?

這個問題的答案就和人工智慧本身一樣,很複雜。

向錢看齊(也向使用率與效率看齊)

高性能計算行業的顧問諮詢公司Intersect360 Research的CEO Addison Snell,負責HPC(高性能計算機群)和AI問題,他表示:「目前,x86還是電腦運算中主要使用的晶元架構,x86架構和AI一樣也有著高度專業化的用途。

他繼續說道:「x86本身就是一個普通的伺服器平台,因此,它必須樣樣精通。而其他晶元,是專門為某個應用開發的,並不需要應付其他的基礎設施。所以操作系統和基礎設施的處理就交給x86架構,並部分交給各種協處理器與加速器處理就行。」

真正的AI技術處理工作與標準的計算或GPU處理過程非常不同,因此市場對專門晶元的需求十分迫切。x86構架的CPU能夠處理AI,但是需要分12步處理,明明只需要3步就可以,有些時候使用GPU也顯得很多餘。

通常科學計算的結果很明確,2+3就是等於5,小數點後面的數字都要很精確,在這一點上x86和GPU都能做到。但是AI的特性是當遇到2.5+3.5的情況,幾乎每次不用計算就能得出6。現在的人工智慧技術中最重要的是在數據中發現規律,而不是精確的計算。

李世石與Alpha Go比賽畫面

簡言之,AI與機器學習的定義是從過往的經驗總結並提高。比較出名的一個例子是谷歌子公司DeepMind開發的AlphaGo阿爾法圍棋人工智慧,開發者為了提高AlphaGo的棋藝模擬了許多場圍棋比賽。再舉一個例子,人們日常使用的Facebook人臉識別AI技術,也是經過多年訓練之後才能準確在照片中識別人臉(Facebook在2012年收購了面部識別公司Face.com,在2016年收購了換臉應用 Masquerade和面部識別公司Faciometrics)

AI機器人學到了東西之後就不會忘記了,這正是機器學習的標誌,AI大概念中的小概念。機器學習的核心是一種使用演算法解析數據、從中學習然後根據數據作出決定或者預測的一種行為。機器學習也可以看作是一種識別規律的機制,比如在機器學習軟體記住2+3=5後,整個AI系統就能用上這一信息,從這一點來看,一個識別技術是否用了AI就很容易分辨了。

再舉個例子,用於自動駕駛車的AI技術,並不會使用決定性物理演算法決定周遭其他物品的移動路徑,只不過是利用過往經驗來判斷其他車是從這個方向來,還是從另一個方向來,因此AI系統是看到動作做出反應。

利用預測性的問題解決方式,AI技術只需要一次精確計算就能得出結論。雖然CPU與GPU也能做出這麼精確的計算,但是過程太麻煩。一個單一的精準小體積晶元就能夠解決,而且更好還更低。

別誤會,功耗與適用範圍對於晶元來講很重要,尤其是對於AI來說,因為在這一領域並不是一種晶元就能全部試用的。AI的核心是機器學習,機器學習的核心是深度學習,這些技術利用不同的配置能完成不同的任務。英特爾旗下的Movidius部門為深度學習專門定製了一款晶元,因為深度學習的過程使用CPU受到了極大的限制。Movidiu的市場市場總監GaryBrown表示:「不是每一款AI晶元都是一樣的,每一款晶元能夠在不同時間處理不同的智能問題。我們的晶元擁有視覺智能,我們的演算法利用攝像頭信號源推斷出眼前的情況,這就是我們開發的重點。」

Brown還補充,「我們甚至還需要區分應用在網路邊緣和數據中心的晶元,在不同領域使用的晶元應該不同。網路邊緣使用的晶元與數據中心使用的晶元無法媲美,例如英特爾公司的至強處理器屬於數據中心晶元,足以應對數據中心AI技術的高性能需求,與智能手機中的AI對性能的需求是不一樣的,智能手機的AI耗電不能超過1w。那麼問題來了,主處理器跟功能單一的副處理器相比差在哪裡?」

畢竟,如果想在智能手機或者AR頭顯中加入AI技術,就要考慮到電力。NVIDIA的Volta架構處理器處理AI很強悍,但是要消耗300w,是沒辦法應用在智能手機上的。

自動駕駛工業叉車技術的里程碑,機器人解決方案供應商Seegrid公司的科技進步主任Sean Stetson認為,目前的AI和ML技術都不適合通用處理器。他表示:「要想運行任何演算法,不管是機器學習還是圖像處理、圖形處理,都有專門的工作流程。如果沒有為不同的工作流程設置專門的計算核心,就會出現多餘的數據和傳輸。在最沒有效率地傳輸數據時,就會產生許多多餘信息和瞬態功率,因為處理器的效率由每項指令使用的電力來測量。」

當然,新AI晶元的出現並不只是因為市場對專門晶元和能源效率有需求。IBM Power系統開發部門的副總裁之一Brad McCredie認為大家都想上這波AI晶元的車還有一個原因是因為獎勵真的很豐厚。他說:「這是IT行業在數十年來第一次看到發展,而且還是呈指數增長的趨勢。出現變化是因為新的資金將進入IT行業,用於AI的開發,就這樣風投資金流入了IT行業。毫無疑問,大家看到的是一場淘金熱。」

全新的生態環境

開發專門用於AI的晶元帶來的不只是科技發展,隨之而來的還有考慮到AI和ML處理相似性的全新量產方式。如果開發了一款AI協處理器,卻用在過時的PC設備,或伺服器中,就好像是將法拉利引擎浪費在大眾的甲殼蟲車中了。

英特爾AI產品項目組的副總裁兼首席技術官以及Nervana公司的聯合創始人Amir Khosrowshahi表示:「人們說的AI和AI晶元,說的是圍繞著許多非AI科技研發的AI解決方案,其中涉及了CPU、內存、SSD和互聯,這些對一個可行的AI解決方案來說缺一不可。」

舉個例子,IBM在2017年底推出Power 9處理器來應對處理重要任務的系統時,將NVIDIA的高速NVLink技術應用在了核心互聯、第四代PCIe和IBM自己的名為OpenCAPI的介面(開放式一致性加速器處理介面)上。OpenCAPI是一款為內存、加速器、網路、存儲器和其他晶元提供高寬頻,低延遲的介面。

McCredie表示,在x86架構的生態環境有點落後了。他指出,第三代PCIe已經上市7年卻遲遲未推出重大更新(直到2017下半年才推出下一代),IBM是第一批應用三代PCIe的公司,他們的x86伺服器現在還在搭載三代PCIe,跟第四代相比帶寬縮減了一半。

McCredie補充道:「隨著計算能力的大幅增長,計算容量也應該大幅增加,我們需要更全能的處理器。處理器達到了存儲帶寬和I/O帶寬,解決了限制系統性能的首要問題。」

他繼續說道:「未來的加速器也會越來越強大,因為工作量加大就會需要更厲害的加速器。我們甚至還打算為資料庫和ERP(企業資源規劃)等常見的工作負荷加速。我認為現在晶元行業呈現出一個穩定的趨勢,就是重點越來越趨向於加速,市面上也出現了更多的加速器。」

流動資產分析科技公司OTAS的CEO Tom Doris爭辯到:「不過單靠硬體是無法完成機器學習的,機器學習的主要部分還是在於軟體。大家爭先恐後開發新款晶元時,卻很少提到與晶元搭配的軟體,那是因為這樣的軟體大部分已經面世了,正等待晶元追上它們的腳步。」

他繼續說道:「如果參考更久遠的歷史,科技發展都由硬體科技推動的,演算法的變化並不大。我離開這行業並沒有多久,當我回來發現這一現象也覺得很吃驚。演算法與軟體從90年代晚期就沒怎麼變過,關鍵還是看計算能力。

據悉,彭博社首席技術官辦公室的數據科學家David Rosenberg,也認為現在的軟體已經足夠用。他表示:「有些領域的軟體因為分散式計算和分散式神經計算的原理需要進一步開發,但是我們已經在軟體開發上很有經驗,所以不需要擔心,目前重要的是硬體能否快速有效地執行這些軟體。

前斯坦福大學教授Ian Buck,開發了CUDA平台(使用平台的開發者可以編寫使用NVIDIA自己的GPU來進行並行處理)的前身,他解釋到,實際上,通過現在的用例可以看出,硬體與軟體正在齊頭並進地發展,目標是支持AI晶元和用例這股新浪潮。在我們NVIDIA,軟體與硬體團隊規模大致差不多。據悉,Buck現在是NVIDIA的AI部門主任。

Buck說道:「我們利用系統軟體、庫、AI框架和編譯程式共同開發了新的構架,只為了利用日益更新的技術和神經網路。在AI行業唯一能成功的辦法不只是開發優秀的晶元,還有將所有的軟體緊密結合在一起,使用並優化不斷推陳出新網路。

對Buck來說,AI代表一種新式計算方法的原因之一是他認為AI用新的辦法將硬體與軟體結合在一起。他說:「我們不用考慮向後兼容性,我們只是在改造一種能夠勝任工作的處理器,這種處理器還需要能配合軟體的運行。」

競爭的終點

雖然今天有很多看似有潛力的AI晶元開發商,然而現階段面臨的問題就是之一就是他們有多少能流入市場銷售,而不是僅提供給供應商,甚至項目被取消。也就是說,今天大多數AI晶元項目仍然存在較大的不確定性。

對於許多沒有CPU製造經驗的設計AI晶元製造商,例如谷歌、Facebook、微軟,這些公司似乎都在開發定製的AI晶元用於自家項目上,很可能永遠都不會推向市場。這些公司憑藉著強大的資金實力,可以投入多大數十億美元的研發資金,而且沒有要求立刻或有明顯的投資收益。

因此,用戶可能會依賴谷歌的Tensor計算單元作為Google Cloud服務,且是特色之一,而不會直接銷售這些晶元。不難猜測,Facebook和微軟也很可能採用這種研發運營模式。

Nvidia自動駕駛平台Drive PX Pegasus

而更多的晶元將會流入市場,例如NVIDIA最近宣布推出三款AI晶元:專為智能機器人設計的Jetson Xavier片上系統、專為自動駕駛計程車以及深度學習設計的Pegasus、專為半自動駕駛汽車設計的Xavier。然而,所有的這些晶元都是基於NVIDIA自家的模擬的環境:Isaac Sim,開發人員可以通過它來訓練機器人並使用Jetson Xavier進行測試。

Intel收購而來的專註於AI的Nervana神經網路處理器

與此同時,Intel也承諾其首款基於深度學習處理器(基於2016年收購的Nervana公司)將於2019年面世,代號為Spring Crest。此外,Intel還擁有一款Nervana晶元,代號是Lake Crest。Intel表示,Spring Crest的性能將達到Lake Crest的3-4倍。

那麼問題來了,所有的AI晶元都能走向成功嗎?

Movidius部門的Brown講到:「我認為未來AI領域將會出現演變,例如如果你想在數據中心中加入AI晶元,那麼你就需要一個數據中心晶元,而如果你想在一個VR頭顯,那麼你會找到另外的晶元。因此,未來可能會產生更多的專用領域的晶元,甚至有可能集成到CPU內部,AI晶元也存在多樣性。」

AI晶元的發展在某些方面確實和CPU早期的演進過程很相似,未來也會誕生一批有優勢的產品,甚至行業領導者的優勢的AI晶元將支持多種用途。想想30年前,80386是當時數一數二的桌面級處理器,如果需要在LOTUS 1-2-3(一種電子表格)進行大量數據運算,那麼可能還需要一台80837的數字協處理器。之後則是80486,Intel又將數字學處理器集成到CPU中,慢慢的CPU加入了越來越多的擴展功能,例如內存控制器、GPU等等。

OTAS公司的Doris指出,許多沒有流入市場的AI晶元雖然受到內部高級技術研發人員的高度喜愛,但變革往往受到行業標準的牽制。Intersect360公司的Snell表示,很多AI晶元領域的初創公司都在所見隊伍規模,這也意味著未來的競爭將更加激烈。因此,這些公司中更寄希望於開發出一個功能強大的基礎型晶元,以此來奪取夯實市場。

IBM公司的McCredie表示,我雖然同意AI晶元的研發是一個艱苦的過程,但賽道將越來越窄,意味著有一天AI晶元領域依舊會向傳統晶元一樣,廣闊的X86架構、NVIDIA的GPU、ARM的生態世界。但就目前而言,這場AI晶元的競賽已經脫離了起跑線,並且競賽選手依然持續跑下去。

(END)

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 青亭網 的精彩文章:

他們用VR手套+Tracker成功的讓盲人「看」到藝術品
6月iOS AR排行榜:蘋果AR測量應用《Measure》強勢登頂

TAG:青亭網 |