為什麼全棧式AI解決方案對AI落地至關重要?| CCF-GAIR 2019
編者按:7月12日-7月14日,2019第四屆全球人工智慧與機器人峰會(CCF-GAIR 2019)於深圳正式召開。峰會由中國計算機學會(CCF)主辦,雷鋒網、香港中文大學(深圳)承辦,深圳市人工智慧與機器人研究院協辦,得到了深圳市政府的大力指導,是國內人工智慧和機器人學術界、工業界及投資界三大領域的頂級交流博覽盛會,旨在打造國內人工智慧領域極具實力的跨界交流合作平台。
未來,AI將變得無處無在。相信大部分人並不會反對這樣的觀點,但要實現AI無處不在的願景除了需要解決算力、演算法、數據的三大挑戰之外,還面臨著成本、複雜性、可擴展性、數據隱私等多重困難。既然AI大規模落地複雜程度如此之高挑戰如此之多,技術的創新有多重要?全棧式AI解決方案能否顯著加速AI技術的落地?
AI帶來了什麼改變?
AI智能音箱、手機AI語音助手、AI拍照、AI美顏都是普通消費者已經觸手可及的AI產品和功能。雖然這些AI產品還不能讓消費者感到十分滿意,但AI顯然是吸引消費者購買產品的一大賣點。
相比消費領域用AI作為產品的賣點,在金融、工業、物流等領域,AI正在改變這些行業。電網領域應用了諸多的AI技術,比如,現在很多電線杆沿河架設,並且線路架不高,儘管有很多「禁止釣魚」的告示和巡邏人員,仍然有很多釣魚觸電的事件發生。賽特斯信息與電網公司合作開發了釣魚監控系統,如果檢測到河邊電網線路下有人釣魚就進行廣播勸離。據介紹,釣魚監控系統在2019年4月部署上線,到7月一共驅離了280餘位電網線路下釣魚人員,並且自系統上線後釣魚監控系統監控範圍內沒有新增的釣魚觸電事件。
基於AI技術的釣魚監控系統顯著減少了安全事故,但AI的價值顯然不止於此。在快遞領域,如何降低交付運營成本,提高服務和運作效率是一大訴求。韻達快遞利用AI解決這些挑戰,最終有效提升了快遞物流系統的運作效率,大幅降低人工勞動的強度和人力成本,節省成本高達7000萬美元。
AI視覺技術在工業領域同樣成效顯著,在大規模產品的製造過程中,以往通過人眼識別對產品進行檢測並發現缺陷不僅效率低,準確率也不高。美的利用AI技術進行缺陷檢測時,圖像預處理的性能提高了4倍,模型推理時間縮短16倍。
在醫療圖像分析領域,健培科技利用AI技術能夠高效完成 X 射線、CT、MRI 和其他醫療成像來源的推理,醫學數字成像和通信(DICOM)圖像分析性能提升了 8 倍。
還有一個很酷的AI應用,歐洲核子研究組織(CERN)負責運行大型強子對撞機(LHC),每秒要進行四千萬次的對撞,會大概產生約1PB的數據,這給計算和存儲帶來了巨大挑戰。他們希望過濾出對研究分析有價值的數據,把每秒產生的數據量從1PB減少到10TB。藉助AI,他們最終成功實現了端到端全數據管道粒子分類器,且易於擴展。
上述案例中,280餘位、7000萬、4倍、8倍、16倍、1PB到10TB這些數字代表著安全、成本、效率的提升,這是AI已經帶來的量化的改變。這些量化的顯著提升背後,既是英特爾與各個行業合作夥伴的深度合作,相互協作解決技術難題,更是英特爾AI技術平台和全棧解決方案實力的體現。
英特爾高級首席工程師兼大數據技術全球首席技術官戴金權
端到端的大數據處理+分析平台是AI部署的關鍵
無論韻達快遞、美的、健培科技還是CERN,他們更關心的是軟體方案如何支撐他們的業務,這也是AI部署中的痛點。英特爾高級首席工程師兼大數據技術全球首席技術官戴金權在CCF-GAIR 2019期間接受雷鋒網等媒體採訪時表示,與客戶合作的過程中,我們發現拿到一個深度學習的模型和演算法並不難,真正把它落地或部署在大規模的生產環境里,大量數據分析的整個流水線整合併不容易,這也是很多用戶的痛點。
他還舉例表示,一家非常大的美國互聯網公司已經設立了非常大的專用計算集群,有分散式訓練,並且分散式軟體也做的非常好,但他們找我們合作。開始我們很好奇為什麼他們已經有這個能力還找我們合作,後來了解到他們雖然開發了很多先進的AI模型,能夠用一些樣本數據在筆記本上得到一個滿意的原型。但碰到一個很大的挑戰,要在生產數據或者歷史數據試這個模型需要大量的數據,把數據拷貝出來並不是一個長久的方法,因此他們希望有一個端到端的平台,把生產數據利用起來。
吸引這家互聯網公司與英特爾合作的是英特爾統一的大數據分析和人工智慧平台Analytics Zoo以及BigDL。BigDL是一個建立在大數據平台(Hadoop/Spark)上原生的分散式深度學習庫,它提供了在Apache Spark上豐富的深度學習功能,以幫助 Hadoop/Spark成為一個統一的數據分析平台,為整個數據分析和機器學習過程提供比現有框架更加統一和集成化的支持。
據悉,自BigDL 2016年10月正式開源,已經有眾多用戶使用BigDL構建深度學習應用。雷鋒網認為,基於Hadoop/Spark分散式系統基礎架構夠在很大程度上降低AI部署的門檻。
為了能夠進一步降低AI部署的門檻,構建一個完整的端到端大數據處理加深度學習應用,英特爾在去年又開源了Analytics Zoo新項目,基於Apache Spark,TensorFlow等更高階的人工智慧的流水線和平台。也就是說,整合了不同的庫和框架後的Analytics Zoo,能夠助用戶無縫從筆記本的生產原型無縫地擴展到集群或者生產化部署。
英特爾與美的的合作就是應用Analytics Zoo一個很好到的例子,美的利用人工智慧的流水線進行缺陷檢測,有大量的圖片需要進行處理,先用Spark進行圖片大規模分散式處理,之後可以直接使用TensorFlow的API,幾行代碼就可以將數據接入到TensorFlow定義的目標檢測模型,進行分散式訓練、推理和測試。得到訓練好的模型之後,就需要部署,利用Analytics Zoo能將訓練出來的模型直接作為一個單機的Python推理代碼嵌入到JAVA的service上,進行實時的推理。整個過程利用了Analytics Zoo平台,實現了人工智慧從雲到邊緣計算完整的流水線,提高開發效率的同時也大大提高了運行效率。
AI一定是硬體+軟體的融合
不過,軟體的能力需要硬體作為支撐。據雷鋒網了解,全新硬體架構每實現一個數量級的性能提升,軟體就能帶來超過兩個數量級的提升。AI時代,軟體和硬體需要不同的策略。軟體的層面,AI的部署需要一個完整的更高級的流水線,還需要像OneAPI這樣統一的軟體平台,解決不同的硬體器件來學習不同的編程框架、編程工具、編程介面的問題。
軟體需要統一,硬體卻需要異構。原因很簡單,現在90%以上的數據是在過去幾年中產生,其中大概50%是在過去兩年中產生,數據大量產生的同時,數據類型也更加豐富,除了CPU擅長處理的標量數據,矢量、空間數據、矩陣數據也大量產生,對應的也需要GPU、FPGA、ASIC處理不同類型的數據。因此,AI時代軟硬融合的重要性更加突顯。因為不同的硬體需要相應的軟體才能充分利用硬體資源,但處理器異構會帶來軟體複雜性大增的挑戰,為了更好發揮硬體性能,還需要更全面的創新。
戴金權接受採訪時表示,在AI越來越普及之後,大家都對AI提出更高的期望,要解決更複雜的問題,對存儲的技術、安全、連接等都提出了一系列的要求。所以從AI長遠發展的角度看,需要一個綜合性方案來解決未來AI發展挑戰。
我們看到,英特爾提出了超異構計算的願景,通過提供多樣化的標量、矢量、矩陣和空間架構組合,以先進位程技術進行設計,由顛覆性內存層次結構提供支持,通過先進封裝集成到系統中,使用光速互連進行超大規模部署,提供統一的軟體開發介面以及安全功能。
其中,架構創新又是六大技術支柱中的關鍵,不僅因為架構創新能實現更顯著的軟體應能提升,也因為架構可以把製程&封裝、內存&存儲、互連、安全、軟體六大技術支柱有機的結合在一起。
英特爾認為,架構創新在未來十年會是主流,也會是創新的主要驅動力,這裡面會有多種不同的架構互相組合、比拼,具體需要看AI的不同需求。架構創新將繼續帶來指數級的擴展效應。
AI普及需要全棧式AI解決方案更需要廣泛合作
可以看到,英特爾致力於提供AI全棧式解決方案,在底層的內核或者庫上有MKL-DNN,還有圖形編譯器nGraph,可以將神經網路編譯到各個平台上。再上層有針對各種機器學習和深度學習框架上的優化,包括Python等常用的機器學習、深度學習庫也進行了大量的優化工作。最上層,提供了更高階開源工具的套件,包括神經網路推理的加速工具庫OpenVINO,統一的大數據分析和人工智慧平台Analytics Zoo。
全棧的解決方案不僅能夠降低AI開發和部署的技術難度,還能根據用戶需求提供更加靈活的解決方案,這對於AI的普及至關重要。
但是,AI已經被應用到眾多的行業,需求也非常多樣,現在每一個行業大家都在快速擁抱AI能力,且每個特定行業碰到的挑戰也有所不同,有的領域可能是技術上的挑戰,比如計算力需要不斷加強,也有一些領域的挑戰是技術之外的,比如在醫療領域,還面臨如何保護病患隱私的挑戰。
因此,技術的提供方在提供定製化解決方案的同時,與生態合作夥伴更好的合作,才能更快促進AI的落地。針對醫療、金融、交通、政府、零售、教育、製造、能源等行業,英特爾定製了從商務到技術的不同模式來匹配,在國內與京東、騰訊、銀聯、美的、韻達快遞、中國人壽、寶信軟體等眾多企業深度合作,支撐中國以及全球AI產業的發展。
最後值得一提的是,英特爾上個月宣布在中國成立大數據分析和人工智慧創新院,加快技術創新與應用,希望加快統一的數據分析和人工智慧數據的創新和應用。
※推出一年多就被關閉,摩根大通的手機銀行Finn為何如此短命?
※小鵬G3 2020款正式上市,進入L2.5級自動駕駛輔助時代
TAG:雷鋒網 |