對話阿里副總裁賈揚清:阿里技術體系的開源策略與思路
今年三月,知名 AI 青年科學家賈揚清從 Facebook 轉戰阿里巴巴,引起行業熱議。外界普遍猜測認為,阿里巴巴尚缺乏一個高效且易於使用的深度學習平台,賈揚清的加入,將幫助阿里解決這方面的問題。
在這次賈揚清的公開亮相中,其在阿里的工作方向疑問終於解開,同時指向了阿里在大數據與人工智慧技術層面的發展方向與策略。
當下,阿里的發展重點並不在框架,而是平台,並且「開源」的精髓——吸引更多開發者來壯大社區和體系——將作為一顆種子深埋進阿里的技術發展戰略中。
撰文 | 四月
本周,阿里雲峰會開發者大會在上海開啟。在開源大數據專場上,阿里巴巴集團副總裁、阿里巴巴計算平台事業部總裁賈揚清向開發者們就阿里將在開源社區以及開源服務的布局做了精彩介紹。
賈揚清,知名 AI 青年科學家,今年 3 月加盟阿里後首次公開亮相。他是 AI 深度學習框架 Caffe、Caffe2、Pytorch 的重要貢獻者之一,並曾參與谷歌人工智慧平台 TensorFlow 的工作,作為 GoogleNet 作者的之一。
截至 2017 年,Caffe 2 是最快的深度學習解決方案之一。可以說,賈揚清深受全球 AI 開發者喜愛的重要原因之一正是其身上自帶的「開源主義」精神,而現在,他將其注入進阿里及中國的開發者生態。
賈揚清談道,阿里雲的開源策略將沿著共存、共生、共贏的路徑發展。
無論是備受關注的大數據、人工智慧技術領域發展,還是放眼到全球各類基礎 IT 技術的發展與迭代,開源式的發展策略都成為大勢所趨,尤其近兩年全球開源社區蓬勃之勢不容忽視。
據 GitHub 數據顯示,2018 年全球新增開源社區用戶達到 3100 萬用戶,大於前六年新增總和;新增 9600 萬個開源項目,佔總開源項目的三分之一。
就中國市場而言,中國信通院企業採購大數據軟體調研報告顯示,中國企業採購大數據佔比情況中,53.9% 的企業選擇開源軟體商業版,32.7% 基於選擇開源軟體社區版,而總計 86.6% 的企業選擇基於開源軟體搭建自己的大數據處理軟體。
談到阿里技術體系涉足開源生態,可以追溯到淘系業務的搭建,到今天阿里雲上面向企業提供的 INS 和 Caffe 服務,阿里技術的底層系統借鑒了非常多的開源項目,從伺服器到大數據以及最新的人工智慧應用。
「如果沒有這些開源項目,對於阿里而言要構建一個完整的業務系統將是非常困難的事情,我們非常感激,我們也非常熱切地和開源系統擁抱。」賈揚清談道。
但與此同時,阿里在將開源應用與自身業務流程整合的過程中,還發現了非常多的具體項目和方案是開源項目中尚未涉及和推出的。於是,阿里基於自身業務需求在開源項目中不斷改進和設計,並將這些結果推而廣之,再反哺到開源社區中去。
賈揚清表示開源項目的發展自是如此。作為典型的上一代人工智慧框架,Caffe、Tensorflow、Pytorch 發展早期帶著明顯的學術界影子,經過工業界和學術界多年來的共同錘鍊,Tensorflow、Pytorch 開始逐漸地融入工業界的典型特徵,比如大規模、彈性、高性能等,部署層面也開始考慮多種環境的兼容,包括端和雲。
對於阿里而言,最經典的「錘鍊」例子便是「雙 11」。
從 2009 年「雙 11」活動興起,經過近十年的發展,阿里「雙 11」的成交規模已經從最初的千萬躥升到兩千億元,訂單量達到十億,巨大的業務壓力催生出阿里技術體系必須針對大體量計算和小場景優化進行攻破。最終阿里也逐步搭建起流式計算的中流砥柱 Flink 框架。
「每個公司壯大之後都免不了碰到這些問題,現在人工智慧我們也發現了類似的情況。」賈揚清談道。
通過不斷的業務壓力推進系統迭代,再反哺到開源社區,阿里對於開源社區的貢獻成績可圈可點。「今年在國內 TOP10 的項目當中,阿里占其中 6 個,像 Flink 就是我們非常自豪的,擁抱開源和被開源的項目」,賈揚清介紹,如果只關注大數據和人工智慧領域,阿里已經向社區貢獻了超過一百萬行代碼。
聚焦在大數據和人工智慧領域,阿里面向開源社區的貢獻集中在四個層面:
1)大數據層面的實時計算,基於 Apache Flink 深度優化,支撐阿里在雙 11 期間等海量的實時計算和分析任務;
2)集團內和阿里雲上共用的深度學習平台 PAI。這是一個基於開源深度學習框架進行深度優化和整合的平台,關鍵性能比 TensorFlow 快 3 倍,完全兼容 Tesorflow、Caffe 語法,並通過底層的優化,比如通訊庫優化,底層跟 CPU、GPU 跟體系結構相關優化等,實現更快的分散式模型訓練和部署;
3)EMR 原生雲大數據平台,比如傳統的 Hadoop、Spark 等基礎架構產品,對接用戶在大數據場景當中遇到的需要承接開源項目的計算模式,不改變上層的軟體應用系統。
4)面向商家實現商業價值的 ElasticSearch 平台。由阿里雲和 Elastic 合作推出,提供企業級服務,解決平台、管控、部署等一系列的問題。
為進一步推動 Flink 社區的發展和壯大,賈揚清和英特爾方面還共同承辦了 Apache Flink 極客挑戰賽,並於活動當天啟動。大賽由 Apache Flink Community China 發起,阿里雲計算平台事業部、天池平台、Intel 聯合舉辦。
首屆 Apache Flink 極客挑戰賽旨在聯合眾多大數據技術愛好者,聚焦機器學習與計算性能兩大熱門賽題,提供 Apache Flink 強大的大數據計算平台與 Intel Analytics Zoo 深度學習計算平台,幫助參賽隊伍實現機器學習的實踐應用,完成計算性能的優化挑戰。
Flink 的核心是一個流式的數據流執行引擎,其針對數據流的分散式計算提供了數據分布、數據通信以及容錯機制等功能。企業依託 Flink 技術體系建立的大數據流處理引擎解決方案,可以更合理更快速地獲得計算結果投入到企業決策。
Flink 的核心團隊組建了 Data Artisans,並在 2015 年初將 Flink 貢獻給 Apache 社區並成為該社區的頂級項目,此後 Data Artisans 持有多個並行流的 data Artisans Platform 成為 Flink 的商業版本。
直到今年 1 月,阿里巴巴集團以 1.033 億美元(9000 萬歐元)的價格收購了這家總部位於柏林的初創公司 Data Artisans。阿里在 Flink 引入內部團隊後打造了 Blink。
目前阿里巴巴所有的業務,包括阿里巴巴所有子公司都採用了基於 Flink 搭建的實時計算平台。另外,阿里巴巴集團副總裁周靖人之前宣布,阿里巴巴內部 Flink 版本 Blink 將於 2019 年 1 月正式開源,這就意味著阿里未來將會主要以 Blink 的身份來投入 Flink 的社區貢獻了。
會後,機器之心參與了針對賈揚清的採訪,訪談中,他不僅談及開發者社區可以如何更好為開發者賦能,也分享了自己對於如何進一步完善「開源」制度與中國 AI 框架的創見性想法。關於他加盟阿里後的職責與工作安排,也如實做了解答。
以下為機器之心針對問答環節的整理內容。
問:我們都知道,阿里在今年 2019 年 4 月份前後正式上線了開發者社區,將包括 MVP 之類的產品都投了進去,也正好在這個時間點我們做了開發者大會,所以您怎麼看大會與您這塊的結合?未來計劃怎麼樣去做開發者的生態建設和賦能呢?
賈揚清:我們從開發者社區中發現到一點,就是就技術領域而言,開發者基本上是排在第一位的,很多創新工作都是從開發者群體這裡首先建構起來的。從大數據跟人工智慧的角度來說,我們首先希望與開發者建立起一個互助的環境,我們看見很多開發者在做大數據或者人工智慧相關的應用時,很多時間都花在怎麼搭建環境,比如今天做人工智慧研究,首先得要買一個 GPU 等等,都是一些很麻煩的事情,我們希望能從這方面給開發者提供價值,使其具備一個良好的開發環境。
另外,無論是在開發習慣還是效率上,雲是可以把這些方法沉澱下來的平台。今天我們回過頭去看一些成熟的開源開發者社區,與我國的開發者社區相比還是存在一定習慣上的差異。打個比方,矽谷的社區更願意利用代碼的及時測試等類似環境,而這些環境恰恰需要通過雲才能取得較好的效果,我們希望能夠幫助開發者們逐漸把這些工具搭建起來;第二是把相關的使用行為、習慣、心態建立起來,使大家在開發效率與最終的應用效率上都能有一個質的提高。
問:您覺得目前中國在 AI 這塊的開發者群體的構成層次是怎麼樣的?
賈揚清:我覺得在 AI 這塊,來自中國或者說華人開發者佔比是非常多的,比如近期在 AI 框架領域做得較好的一個中國開發者,也一直在華盛頓大學帶領與培養類似的社區發展。我自己也一樣,在正式踏上工作崗位後,也會把這種開源的心態逐漸帶到企業中去,然後與企業的開源理念一同去推進這件事情,所以我對此還是非常有信心的。
問:但在我看來這一塊基本上是斷層的,有一部分確實是非常優秀,但大部分人基本上可以說都在入門階段,可以在日常生活當中去參與到的項目還是比較少的,但是他們有這種意願,包括應該怎麼入門,像您說的搭建環境,但其實對環境的要求還是比較高的,您覺得要怎麼樣提升中低層開發者群體的學習認知,在這方面可以怎麼去做?
賈揚清:我覺得這一塊不能說是中低層的關係,而是大家開發習慣上的不同,我們開發時很多時候會更加重視業務成果,這時我們就會發現,很多項目的落地要比一般開發者社區更快,但同時在設計上,包括工程效率等方面還是存在可以提升的地方。
這一塊我覺得最值得做的事情,同時也是我個人對開發者社區這個工作非常有熱情的原因,就是很多時候大家都沒有機會接觸或者了解這些開源的玩法或者說工程的實踐。比如測試,大家在接觸以前可能會認為這個時間花掉了,卻沒有看到什麼成效,直到後來有個項目越滾越大後才發現,測試缺位的結果是每次部署時大家都很累,大家都綳著神經揣測項目會不會「壞」,如果說從一開始做項目時就有測試或者代碼審核機制的存在,長期來說對效率的提升是有所幫助的。
這些事情從一定程度上來講,得從心態上開始培養,或者說有了一些比較好的體驗跟故事後,整個類似的流程才會逐漸建立起來。我們做 Flink 其實也有類似的感受,在跟德國團隊合作的過程中,我們發現雙方的開發風格存在著不一樣的地方,比如說我們這裡的速度非常快,很多東西可以馬上推出去,但是在做代碼整合時就會發現值得商榷的地方,比如是否設計得足夠模塊化、是否好對接,還是說純粹嵌入式地往裡做開發,就會發現不同背景的團隊大家的做事風格不一樣,所以我們最近做了很多事情,讓兩個團隊互相學習對方的長處什麼的。
剛開始整合時雙方團隊還會有些擔心,但今天大家已經可以合作得非常好,通過互相借鑒對方的長處,把事情推進得更快。所以我覺得我們的社區,可以通過比如跟國際社區的合作什麼的,也能從類似的經歷中獲得一些經驗。
問:我覺得開發者的範疇如今正在變大,比如說我們看到很多企業里存在一些非 IT 類的編程,他們把這種能力作為他職業生涯的擴散培養,而且有的企業會做出來一些小東西,比如說在走訪工廠的過程中我看到,本來是在生產線上的員工,如今自己已經可以做出來一些工具,包括一些小朋友能夠做出 AI 談判編程,跟阿里的開發者相比,他們算是一個定義比較廣闊,但稍微更偏應用的開發者,您對這樣的人群有什麼樣的建議?比如說怎麼樣能快速讓他有成就感,快速對開發世界感興趣呢?
賈揚清:我覺得這是一個挺有意思的事情。我的領導是主攻經濟學的,但他最近也在學習這方面的事情,一個是覺得很好玩,因為只要有數據就可以拿來解決相應問題,另外也因為考慮到開發者是更偏嚮應用以及最終場景的用戶,只有這樣才能提供更加易於使用的開發者界面。
以前我們說到開發者平台時,更多會想到編程平台,比如說微軟的 IScloud,即是底層系統的開發平台。但今天我們也看到,數據科學家的開發者平台是什麼?這一塊是我們想做的,比如說今天有一位做財務的同學找過來,表示想分析財務數據以及做財務預算,他要找什麼樣的開發者平台才能滿足需求?我們之前在大數據這塊就做了一個叫 Data Works 的平台,讓大家可以更加簡易地使用引擎,同時我們還組織了雲棲編程大賽,讓大家在面向數據的開發者平台上構建更簡易的應用等。
過來大會以前,有支隊伍做了一個非常有意思的成果,他把杭州基於位置的氣象數據整合起來,然後在 DataWorks 類似的平台上做應用,第一項是氣象數據的可視化,能知道地圖上某個區域今天的天氣是什麼樣的;第二項是做氣象預測,只要確定前面 7 天的氣象情況,就能判斷出明天的天氣情況。所以我們能夠看到,類似的數據平台可以讓大家輕鬆地把數據利用起來,這是我們一直在努力推廣的方向,不應該只有針對系統的開發者平台,還應該包括如何應用數據的開發者平台,對吧?
問:想聽您簡單介紹一下,Flink 開源社區與其他開源社區相比有什麼特性,或者說阿里為什麼選擇它作為自家開發者的一個培養土壤?
賈揚清:我覺得它跟其他許多開源社區都還蠻像的,都是有幾位對某個方向特別熱情的同學或者工程師,從 0 到 1 建立起項目來解決一個實際問題。阿里之所以對 Flink 感興趣,是因為它在流計算的場景上有非常好的表現,過去我們說大數據處理,其實涉及非常多的數據處理場景,比如說晚上有大量數據沉澱在資料庫的存儲環境里,由此需要跑相對較長的工作時間。
很多時候我們是需要靠實時計算的,最典型比如說雙十一,如果想知道凌晨 1 點的銷售額,也就意味著需要快至秒級的延遲,但這一切依然需要建立在非常大的資料庫基礎上。為此,我們投入了大量精力在 Flink 上做相關優化,這是從我們業務的需求出發的。然後我們內部逐漸長出一個 Flink 的分支叫 Blink,說明我們對於 Flink 還是很有信心的,也看好它作為計算大數據的引擎的前景。去年我們收購了位於柏林的 Data Artisan,這樣就可以第一個把自己的力量貢獻到社區里去,另外也可以幫助推動 Flink 的產業和生態發展。
這就是我們對它感興趣的原因,首先是自家的業務驅動,然後是對該社區與相應的場景非常有信心。
問:Flink 其實一直在追求統一,我想問一下您對這個統一的看法。
賈揚清:很多時候大家都在講統一的故事,其實這是有背景的。在流計算的場景下,我們往往需要具備一個 批 計算的應用,如果這時候我們完全換一套引擎過去,其實花的精力還更多一些,所以就出現了在主要設計流的場景下,偶爾需要 批計算 的一個 5%、10% 的場景。換句話說,在每一個引擎里 Flink 會做 Blink,大家可以補齊自己的應用短板,對應用而言,等於是提供了端到端的體驗,大家不需要再因為一個項目而整個數據都要挪一遍。這方面我認為 Flink 會繼續加強在計算上的領先地位,同時對 批 計算、互動式查詢做補齊,讓用戶可以在一個相對綜合、以流為主的場景下,可以快速構建起自身的解決方案。我認為每個引擎還是有自己擅長的領域,至於做統一,是為了給用戶提供一個更為完整的體驗。
關於開源
問:上次交流到關於 Flink 的開源,據了解阿里這半年還會有開發者大賽,您也提到了您過來其實是希望能夠推動國內的更多開源行為,後續阿里在開源 AI 層面的策略是什麼樣的?包括目標以及希望獲得什麼。
賈揚清:我們目前也在逐步梳理當中,目前初步的想法可以分為三塊:第一塊是加了雲的原生操作系統,沒記錯的話阿里前段時間發布了最新版本,我們正在深入地與一些開源組織進行合作。
另外一塊體現在前端上,螞蟻有一個開源項目就是屬於前端交互應用系列的。
第三塊是我們一直很感興趣的工具層,即是如何利用開源項目與解決方案來幫助開發行為變得更有效率。我們希望在這三塊都能有所作為。第一步是完整的梳理,接下是結構化地往前推動設計。
問:阿里是希望工具包進行開源還是希望大家能夠共贏?這個可以具體談一下嗎?從阿里和開發者各個方面。
賈揚清:其實大家在工業界都看到了這樣的問題,比如 10 年、20 年前,無論是在國內還是國外,應用開源項目與社區的緊密程度往往決定了應用的成敗。雖然每個公司都進行了所謂的模改,然而最終社區的能力和公司的能力還是相對比較分散,這是剛開始大家對開源運作模式不熟悉所造成的結果。
我認為我們今天已經從這些經驗教訓當中學到了足夠多的社區對接經驗,比如我們現在開源的一些功能,首先是有公司深入參與其中,其次大家都會把軟體上的能力或者系統架構上的思維都貢獻出來,並做成整套的系統方案,而不是給每個人把開源拿過去改一通。因為這樣一開始的效果可能很不錯,可以快速進行搭建,但可能後來就改不回去了,還可能導致我們沒法運用社區的更新功能。
一起努力共同來建設,有一個完整方向,我們才能做得更好;對公司而言,它能夠更有效地利用開源的最新成果,因為社區是一個很大的開發者組織,光靠公司的力量有時不一定能夠很好地推出新方向;從社區的角度來說,當公司開始更真誠地參與推動發展,而不是拿完一個開源項目就不回來了,這個我覺得都是一些很好的變化。
問:現在公司參與開源的興趣很高,但各個公司的利益訴求是不一樣的,大家應該怎麼樣去促進技術方向的合作?
賈揚清:這是一個挺有意思的問題。大公司可能更加關注系統的效率,小公司可能更加關注開發的效率,大家經常說像阿里那麼大的公司,底層系統效率能夠提升 1%,就是非常大的改進了。
對一個創業公司來說,最開始他可能會關注業務迭代方面的事情,這一塊從我個人的角度來看,系統設計等方面其實開始逐漸轉向更加模塊化、一定程度上可插拔的設計,如果有公司關注底層系統的優化,還可以與性能設計等迭代進行解耦。
在我們跟英特爾、英偉達合作的過程,包括針對 AI 框架做優化等,都是大家首先利用各自的強項給項目做共享,另外一點是,我們會做一個較好的模塊化設計,讓大家在往前推進項目時互不影響,我覺得這是一個可以從技術上來解決的「異中求同」問題。
問:未來您認為是以流計算為主嗎?
賈揚清:未來我們將看見越來越多的流計算,包括互動式計算等應用場景。最後究竟是會以流計算還是 批 計算為主?我覺得中國在未來很長的一段時間內兩者都會同時存在,這是因為兩者各自場景的優化等都還比較獨特,因此很難用引號來解決所有的問題。
問:能不能概括一下客戶在基於一種什麼樣的情況下,或者說基於哪一個業務場景下才會選擇阿里的大數據解決方案?
賈揚清:我覺得阿里在雲、資料庫等方面的一系列解決方案都能為客戶提供價值。一方面是雲上能夠提供更穩定的環境,另一方面是軟體的可用性,可以快速拉起不同軟體的應用,像搭積木一樣,把各種能力放到一起,然後用戶可以更加專註於自身的業務場景搭建,而無需在基礎設施上花費過多精力。舉個比較好懂的例子,大家現在用電,誰也不會自己專門去建一個發電廠,大家會做的可能就是建一個 UPS,然後把兩個電視放在那兒。
第三點是可以提供較好的彈性能力,阿里的雲上擁有許多用戶察覺不到的配置或能力,最典型的比如配置機器時的收麥機器和庫存機器,可以在保證不斷增的情況下,快速獲取想要的資源。如果自身來搭建 IDC,首先要採購,加上進行部署,幾個月時間就這樣過去了。而雲上的機器擁有非常好的彈性伸縮和部署能力,自己買機器的話很可能還處於上一代,而且買一個就只有一個;雲上買的話,一個將來可以抵十個,並且可以非常快速地進行部署,這些是雲上所能提供的與傳統線下不太一樣的能力。
問:這也意味著在做高效擴展的時候,使用雲端的話可能會有一些相關的技術方案?
賈揚清:在數據不斷擴大的情況下,雲的基礎設施可以提供一個很好的生存能力,另外它還需要大量的計算力,無論是在線還是離線等相關的,這時雲上的計算能力對他來說會是更加容易獲得的資源。
問:可以理解它是基於雲上的處理能力?
賈揚清:從處理的角度來說,差不太多。但從用戶的角度來說,我究竟是選擇在雲上還是線下做計算,可能軟體這一層客戶自己也能部署一個,但云上所能提供的首先是伸縮性,再來是軟體擁有大量基於用戶理解而採用的一些模式,包括系統上的一些所謂系統特性等,換句話說雲上軟體的性能可以提供更好的服務,無論是從價格還是從性能來看,都是很好的區分度。
問:您所在的部門是把大數據和 AI 整合到一塊了嗎?
賈揚清:是的,個人覺得從全球範圍來看,只有少數企業會把大數據和 AI 放到一起組成一個部門,但我覺得這是一件講得過去或者說非常有道理的事情。為什麼呢?我們今天說人工智慧,很大一部分原因是因為有數據。即是很多人工智慧其實一定程度上可以說是一個數據智能,對吧?所以我們今天再看,發現有兩種計算開始流行起來了。第一種我有時會把它叫做「智能計算」,像訓練、模型迭代等;另一種是「數據計算」,即是如何把大量的數據灌到人工智慧訓練和推解的場景里。
把這兩塊計算結合到一起時,才能把整個解決方案給做出來,所以我覺得從這個角度來說,人工智慧跟大數據的結合是特別自然的一件事情。
問:能把這邊的產品研發架構介紹一下嗎?就是比賽跟大數據兩方面結合,是在朝哪一個方向做的研發?
賈揚清:這個要從研發團隊的角度來說,大數據團隊與人工智慧團隊擁有各自擅長的領域,而這些團隊之間如今也在進行著緊密的交流和對接。其實我們看分散式計算,它的數據輸入是通過 mini batch 進來的,從人工智慧數據的角度來說,我看到的是數據流進來,從 Flink 的角度來說,是提供一個數據流出去,所以這些團隊就可以通過互相合作等方式將整個鏈路打通。Flink 團隊管 Flink 的事情,人工智慧團隊做人工智慧的事情,這樣兩者之間就會有很好的對接,這是他們當下的一個合作模式。
問:說您所在的計算平台事業部和阿里達摩院有合作?
賈揚清:對,能夠跟達摩院合作,其實有點躺平了的意思。
問:演算法方面剛剛提到了達摩院裡面設有視覺、NLP 處理,再上一層應用層還有一個數據智能,屬於大腦方面的,底層還有計算基礎設施,揚清這一塊是平台層,基本上是承上啟下的一個作用。
賈揚清:對,最底層肯定是基礎架構,然後在基礎架構的基礎上再去構建資料庫、大數據等,往上的話則是垂直的應用領域,比如說圖片是一個、三元處理是一個、語音識別是一個、推薦系統是一個,這幾個垂直的解決方案再往上,我們有有整合解決方案。如果今天要做城市大腦,首先它需要有 IoT 端的各種信號輸入,對吧?還需要像視頻理解、圖像理解、整合大數據的數據分析歸總能力,包括數據的控制等一系列事情,我們的上層大腦能夠幫忙把不同的積木搭成一個整體解決方案,推到用戶那兒。
同時用戶也可以根據自己的需要在不同層級做接入,比如說有個公司只需要用到虛擬機,他可以只選擇購買虛擬機,如果他只需要用到平台,可以只購買平台,總的來說是一個比較靈活的處理模式。
問:就 AI 框架領域來說,在您加入阿里之後,中國的 AI 框架會面臨什麼樣的變化?
賈揚清:從幾年前來看,大家好像一談到 AI 就自動把 AI 等同於 AI 框架。從今天來看,我覺得整個 AI 工程解決方案做出來,其實只屬於框架中很輕的一部分。好比說計算機編程領域的 C ,它就像今天的框架,屬於比較好用的語言,但光有它是遠遠不夠的。再比如說 Pytorch,它真正的價值體現在,一個是擁有非常好的生態,一個是擁有非常多的科學計算和外部服務等。所以說這一塊從框架開始,往上和往下都有更多的領域需要我們給予更多關注。
今天我們看 TensorFlow 類似的框架,它的國家屬性沒有那麼強,更多是作為一個開源的領域,其次它提供了更多工具來促進更多的系統和應用創新。系統上的創新比如怎樣做高性能的計算、軟硬體的協同設計,包括今天我們看到一些模式指導我們做新的晶元設計,怎樣把新的晶元更好地嵌入到 AI 晶元里去,是往下應該主攻的方向。
往上做的話,框架本身其實沒有提供太多關於怎麼做大規模訓練的指導,包括模型的迭代等,所以我們現在關注的一個是擁抱框架,一個是把 AI 整個鏈路做出來,這裡舉兩個很好的例子,前段時間阿里開源了一個叫做 MNN 的引擎,可以讓我們更好地在手機端,包括嵌入式端來運營模型;我們還有個項目叫 XDL,試圖解決怎麼構建大規模的吸收化推薦系統的問題,這個建模是很多框架上面是非常欠缺的一層。換句話說,框架上可以做這個東西,但需要有一個高層框架,或者是跟業務更加相關的框架來解決這個問題。為什麼說大規模吸收的系統很有用呢?因為所有的推薦系統都與它相關,比如阿里巴巴做推薦,都會涉及到吸收的數據,所以這一塊光有框架解決不了問題,所以我們希望通過整個站上來做發力。
※集多種半監督學習範式一體:谷歌研究提出新型半監督方法MixMatch
※位元組跳動開源高性能分散式訓練框架BytePS,支持PyTorch、TensorFlow等
TAG:機器之心 |