滿足實際算力剛需，光靠硬體為什麼不行？

新聞 07-20

計算硬體的發展幫助 AI 解開了算力的「無形枷鎖」，但是，在一些業內人士看來，這或許會造成新的困局。近日，Facebook 的人工智慧副總裁 Jerome Pesenti 在公開場合表示了其對 AI 演算法開發過於依賴硬體算力的擔憂。

根據他的觀點，機器的計算能力已經較之前有了較大的提升。然而，這一輪的硬體算力進化還能保持多久的強勁勢頭？現有的 AI 對硬體算力形成的強依賴性，可能會成為新的增長阻力。

應對 AI 對算力強依賴性的一個思路是，軟體和硬體實現協同優化。這是未來半導體行業新的發展趨勢。畢竟我們現在處於一個軟體定義的時代，軟硬協同可以更好地滿足用戶的需求。

很多以計算硬體為主的公司，如英特爾，也早已意識到軟硬體協同創新對性能增長的重要作用。英特爾擁有超過 15,000 名軟體工程師，在新近提出的六大技術支柱中，軟體也是其中之一。

「軟體定義」幾乎支配了現代硬體設備的智能化演進，尤其是在消費電子上，帶來智能手機、PAD、智能汽車等一系列產品的問世，這個趨勢同樣也在影響上游的半導體領域。

英特爾就認為，整個 AI 計算技術一定會走向硬體軟體結合。

圖丨英特爾人工智慧戰略：社區軟體硬體（來源：DeepTech）

目前，在計算架構上，英特爾將計算類型分為標量（Scalar）、矢量（Vector）、矩陣（Matrix）和空間（Spatial）四類，分別應用於 CPU、GPU、ASIC 和 FPGA。這 4 類計算分別對應不同場景下不同類型的數據。例如，金融交易的數據更多屬於標量計算，即輸出風險等級的概率數字，而語音、語義處理則更傾向於矢量計算，需要把語言或者文字進行矢量化。

但無論是什麼類型的計算，這些計算硬體的性能還需要軟體的配合。這也是為什麼近幾年來英特爾的發布會、技術展示日上，軟體創新的「存在感」越來越強。在最近於深圳舉辦的英特爾人工智慧大會上，該公司在軟體上取得的進展同樣沒有缺席。

英特爾的一位技術負責人對 DeepTech 表示，軟體社區和硬體社區相互交流，並真正去思考彼此的問題，比以往任何時候都更重要。「對於全新硬體架構的每一個數量級的性能提升潛力，軟體能帶來超過兩個數量級的性能提升。如果想實現指數級的增長，必須要硬體和軟體共同創新」，他說。

DeepTech 了解到，過去幾年，英特爾在不斷投入軟體團隊的資源，以應對實際的 AI 部署過程中出現的客戶痛點。

英特爾高級首席工程師、大數據技術全球首席技術官戴金權對 DeepTech 透露，英特爾和很多的用戶、客戶在合作過程當中，發現實驗室或者網路上的深度學習模型或者演算法可能開發難度並不高，但是真正落地或者是部署在大規模生產環境中時，會出現新的痛點，比如說大量的數據處理分析和流水線的整合併不容易等等。

以醫學影像場景的 AI 計算需求為例，將人工智慧應用於醫療影像推理是非常複雜的，需要強大的處理能力來應對數據多樣化、深度學習和複雜標記等挑戰。

醫療影像分析需要支持 3D 甚至 4D 深度神經網路（DNN）體系結構，在處理過程中嚴重依賴於平台內存。GPU 通常無法滿足處理 3D 和 4D 影像數據時所需的大量工作負載。因此，醫療團隊通常採用減少 3D 影像數據的像素，並將其分割成多個小的影像塊進行順序識別。

杭州健培科技有限公司董事長程國華對 DeepTech 解釋道，在醫學影像 AI 計算中，團隊發現有一些特別的應用用 GPU 方案或者其他方案來做效果並不是特別好，尤其是三維方面。「使用三維的深度學習來做一些分析的時候，會為了速度不得不降低一些像素的要求、體素塊的大小去滿足速度上的要求」，他說。

為此，英特爾給健培的解決方案中配備了對 TensorFlow 做的優化的數學核心函數庫——MKL-DNN。據介紹，這個庫有 5000 多項對 TensorFlow 計算方面的優化，健培的一些演算法模型平移到這個核心庫進行計算，軟硬結合之後速度又有新的提高，實現了圖像讀取性能上 8 倍的提升。

「TensorFlow 的優化不是我們這樣的公司應該做的事情，而是平台應該做的事。這種對 TensorFlow 的優化在醫學影像 AI 計算上有立竿見影的效果，比如說成本降低了，不用再採購更多的計算單元。對企業而言，省下成本，就是利潤」，程國華說。

（來源：DeepTech）

除了醫學影像場景的具體計算優化以外，在軟硬協同演進上，還有一個思路是將軟體的指令集技術內嵌在晶元方案內部。一個最新的進展是，英特爾在為第二代至強可擴展處理器已經內嵌針對 AI 場景進行加速的指令集——DL Boost 加速指令集。

據了解，這個指令集針對 AI 的推理計算，通用的處理晶元經過指令集加速以後，第二代至強處理器 9000 系列、8000 系列的性能評估顯示，推理應用可以達到非常高的水準，甚至在某些場景上面超越 GPU 加速器方案的性能。這種性能正是通過計算技術的軟硬體結合帶來的。

目前，英特爾 AI 的產品線已經提供了從端到端的豐富產品線的布局，既有通用計算的平台方案，又有加速器的方案，覆蓋了從邊緣一直到雲端的計算場景，而具體到接下來的軟體創新上，其策略是「一個架構，圍繞架構進行擴展」：對於開發者來說，它應該易於使用，而且不僅可以擴展到所有的架構，更可以擴展到所有的操作系統；向所有人開放標準，英特爾擁有業界最好的開源實踐；提供統一的開發體驗。

英特爾也對 DeepTech 表示，公司現在正在和 AI 軟體生態鏈的廠商、包括開源業界進行緊密合作，把一些最新的 AI 加速指令集融合到最主流的 AI 計算框架當中去，例如 PyTorch、Caffe、Tensorflow，通過利用這些最新的指令集滿足更高的 AI 計算需求。

今年下半年，英特爾也將宣布其軟體項目「One API」取得的重要進展。「One API」旨在將為開發者帶來一套能提供一個統一編程模型的工具，以簡化跨不同計算架構的應用程序開發工作。

不難預料，在接下來的很長一段時間裡，新的架構、新的計算方案面世的同時，針對軟體層面的優化還會越來越多，半導體領域的硬體公司和軟體公司的邊界也會越來越模糊。未來，對於半導體行業來說，新的競爭戰場也不再局限於硬體，「軟實力」也會是重點之一。

-End-

坐標：北京·國貿

請隨簡歷附上3篇往期作品（實習生除外）

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 DeepTech深科技 的精彩文章:

※谷歌為何資助這個「偽科學」？麻省理工發冷聚變最新研究，知名華人科學家回應
※「火眼金睛」的 AI：透過聲音看到臉

TAG:DeepTech深科技 |