模擬AI或讓這家公司變成獨角獸
來源:本文由公眾號半導體行業觀察(ID:icbank)翻譯自「nextplatform」,作者Nicole Hemsoth,謝謝。
發展至今,人工智慧推理有兩種趨勢,目前只有少數幾家公司深入其中。
一個趨勢將我們帶回到模擬計算引擎的未來,模擬計算引擎可以大大降低功耗和潛在成本,但對複雜性的創建和避免會產生一些影響。很快就會有更多信息。
第二個趨勢是,任何公司進入推理市場時都會採用類似的方法,通過對數據中心和邊緣推理的雙重關注來對沖他們的賭注。更具體地說,在邊緣設備中使用相同的體系結構,因為它可以像加速器一樣塞進PCIe。
雖然我們談論AI推理的趨勢,但請記住,在數據中心,CPU仍然是王者。卸載加速模型尚未在工作流程的這個特定部分中流行,但隨著訓練有素的模型複雜性(和ROI)不斷增長,它將變得有意義。足夠讓大公司去建立自己的公司。也就是說,除非有人這樣做,否則在經濟上和技術上都是不可行的。
其中一家屬於融資型的少見的推理初創公司剛剛獲得了很多流動資金,以資助他們進軍數據中心並應對上述挑戰。我們去年介紹的Mythic,宣布了3000萬美元的B-1系列賽,總籌資額達到8600萬美元。
如果您必須跳過我們的體系結構簡介,那麼這個簡短的故事將從2013年開始,這家公司就開始著手進行數十年的模擬設備方面的大量工作,並聲稱已經完善了一些極為複雜的模擬到數字(然後再返回)電路,以及對複雜神經網路推理操作的優化(CNN,RNN,著眼於變壓器網路和谷歌和其他超尺度研究實驗室提出的人工智慧的其他新方法)。
有人可能會說,Mythic的數據中心野心會受到對邊緣設備的過分強調的影響,而邊緣設備才是真正的主流機會所在。尤其是因為該市場主要由超大型計算機組成,這些計算機要麼測試一個新設備需要足夠長的時間,以決定自己構建一個新設備,要麼在他們的晶元發現這些數據中心的內部之前,將一家初創企業置於資金短缺和開發失敗的岌岌可危的境地。
雖然可以在新興的邊緣主流中保持利潤率,但數據中心的思維共享潛力是香餑餑。這是幾家旨在培訓和推理的人工智慧晶元初創公司都在尋求的,但考慮到潛在大客戶的數量有限、他們傾向於按規模建造和購買,延長了硬體鑒定時間,很難說這些需求中是否有一個得到了很好的滿足。需要大量的軟體集成,對高級路線圖的需求……直截了當地說,數據中心可能只是一個遙遠的希望,即使是對最好的技術和開發來說。
但是,正如Mythic首席執行官邁克·亨利(Mike Henry)告訴我們的那樣,有很多方法可以繞過那些阻礙他們獲得大客戶的障礙。而且他認為他們或許能夠做出讓最大公司無法拒絕的推斷。嗯,更準確地說,是他們不願意拒絕,因為從開發和成本的角度來看,這是沒有意義的。
「關鍵是要有一個真正與眾不同的東西,那就是那些超大型計算機無法自行建造,如果他們不得不這麼做的話,一定是成本足夠低在驅使他們,」亨利說,他確實有這樣一個觀點。「這些公司擁有大型系統和硬體團隊,但他們擅長構建大規模數字集成和系統。除了一些網路通信結構之外,我還沒有看到這些公司生產出任何複雜的模擬晶元。「這並不是說團隊在這方面並不努力,但正如亨利解釋的那樣,需要花費數年的時間來完成所有這些工作。模擬/數字轉換是正確的,更不用說其設備在邊緣或數據中心工作所需的許多其他優化。
「如果你看一個相對簡單的模擬設備,比如德州儀器的汽車感測器,晶元上有8個模數轉換器。它們具有高採樣率,8-16位精度,感測器上可能有8個晶元,「他說。「我們的問題是把大約22000個這樣的晶元,同時保持大致相同的功率預算。這些轉換器在晶元上的規模遠遠大於之前的任何轉換器。而且我們必須弄清楚如何使它們變得小而薄,以便在不影響功耗預算的情況下將它們與快閃記憶體排列在一起。」
訓練一個模擬設備進行數字訓練的神經網路並不是一項小任務。亨利說,大多數深度學習工作的複雜數據流根本不適合模擬。「我們必須構建大量的數字環繞結構,以便為這些網路提供可編程和靈活的架構。當我們考慮接下來幾年需要什麼時,我們意識到它在計算方面有很多原始的暴力矩陣數學能力,沒有任何特定的網路加速器,而是內置的數字轉換能力數據輸入和輸出以運行CNN,RNN,張力和變壓器網路以及那些新事物。我們花了五年多的時間,可以跟上拓撲結構的變化。但關鍵是模擬到數字(反之亦然)。」
「人工智慧是半導體行業所知的一種全新的工作量。它注重低精度,內存密集,從控制流的角度來看,計算很簡單。使用現有內存進行模擬計算可以解決摩爾定律無法解決的瓶頸。」
這一點很難說。谷歌、Facebook、亞馬遜和其他一些公司當然可以找到並利用專業知識來構建模擬設備,但是為什麼當複雜性和提升時間很長時,他們會為驅動和設備本身的重新改造而煩惱,現有的且相對便宜的存儲技術意味著成本/收益開始看起來有些不平衡。唯一的優勢是完全控制架構以實現開發速度軟體的進步,但即使這樣也是一個延伸。
另一方面,這個星球上有很多模擬的專業知識,很多容易獲取的內存,製作推理晶元可以成為任何人的遊戲,在這基礎上,事情將變得更容易,那些初創公司可以採用與Mythic相同的雙市場方法。但這只是商業和競爭的工作方式,正如我們在最近的一個風投小組所聽到的,推理仍然是任何人都可以玩的遊戲。
「當然,在研究生院,有人可以組裝一些顯示模擬計算的電路,但這與大規模生產相差甚遠;這並不是把它運送到一堆設備中,或者在TensorFlow中載入經過訓練的網路。最困難的部分在於載入精度可忽略不計並確保數百萬晶元的一致性,」亨利補充道。
Mythic在過去幾年中所延伸的研究和開發風險可以通過強調市場仍然在很大程度上未定義且可能對某些利基市場具有爆炸性的邊緣來緩解。這使得對雙重策略的新一輪投資聽起來不如那些注入AI加速器的資金那麼可怕,AI加速器在框架和事實上的設備改變很久之後才最終進入市場(正如我們在培訓加速器時看到的)。
我們非常希望聽到一批全新的晶元創業公司試圖從邊緣剝離。此外,我們還希望聽到一些知名公司幾十年來在模擬設備領域取得了巨大的成就,並最終有機會利用當年最熱門的工作量來激活他們的業務。像這個領域中的許多其他事情一樣,市場上的「解決方案」將遠遠超過那些複雜到可以保證任何事情都不受限制的人。但是,如果問題足夠持久,那些植根於人工智慧的問題會推動硬體的真正戰鬥。
基於這點,最大的模擬人工智慧推理晶元故事來自IBM,它也在開發基於8位相變存儲器的設備。
Mythic的故事也告訴我們,這是關注世界記憶製造者正在發生的事情的好時機。雖然數量不多,但在Mythic的新聞中,見到了業界巨頭美光公司(Micron),美光風險投資公司(Micron Ventures)也加入了這輪融資。
**點擊文末閱讀原文,可閱讀英文原文。
*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯繫半導體行業觀察。
今天是《半導體行業觀察》為您分享的第1996期內容,歡迎關注。
打開今日頭條,查看更多圖片2018半導體行業資料合集 長期有效!
半導體行業觀察
『半導體第一垂直媒體』
實時 專業 原創 深度
華為|三星|台積電|博通|EDA|AI|美國|IGBT
回復 投稿,看《如何成為「半導體行業觀察」的一員 》
回復 搜索,還能輕鬆找到其他你感興趣的文章!
點擊這裡,閱讀英文原文!
※探討延續摩爾定律的新方法|半導體行業觀察
※?富士康:肯定做半導體,但絕對不會做晶圓廠|半導體行業觀察
TAG:半導體行業觀察 |