阿里首次開源深度學習框架X-Deep Learning
今年,各企業在開源路上的勢頭可以說是「你追我趕」,誰也不甘落後。6 月,小米宣布開源自己在移動端深度學習框架 MACE;9 月,騰訊 AI Lab 宣布開源一款自動化深度學習模型壓縮與加速的框架——PocketFlow。雙十一剛過,阿里巴巴就宣布要把商業操作系統中一個重要的業務板塊——阿里媽媽的重要技術框架進行開源,這也是阿里巴巴首次公開深度學習框架。
作為阿里巴巴旗下的大數據營銷平台,阿里媽媽基於自身廣告業務,自主研發了深度學習框架 X-Deep Learning(下文簡稱 XDL),並已經大規模部署應用在核心生產場景。相關代碼鏈接將在 12 月中旬正式發布。
▌1.XDL 面向廣告、推薦、搜索研發,覆蓋核心場景
XDL 是首個面向高維稀疏數據場景的深度學習開源框架。數據的高維稀疏性既是阿里媽媽業務場景的重要特徵,也是互聯網的眾多核心應用場景(如廣告/推薦/搜索等)的特徵,覆蓋了大多數互聯網企業的數據應用模式。新框架 XDL 針對阿里媽媽業務數據高維稀疏的場景特點進行了優化。此外,微博、抖音、今日頭條等也屬於該範疇內,XDL在這些場景中都具有通用性。因此,不管是以廣告、推薦、搜索為代表業務的企業級用戶,還是對此感興趣的個人用戶,都可以加入到開源計劃當中。
另外,在阿里巴巴XDL開源之前,業界的深度學習開源框架基本是面向圖像、語音處理等場景數據而設計,這與整個人工智慧領域的研究重點有關,圖像和語音是率先取得理論突破的場景,而 XDL 的開源可以說是首次在工業級互聯網場景中取得突破。
▌2.開放與易用,是阿里巴巴具備開源 XDL 的技術標準
XDL 採用了橋接的架構設計理念,打造面向工業級應用的分散式規模能力,單機能夠處理的計算則引用現有開源框架。這種橋接的架構,使得 XDL 跟業界的開源社區是無縫對接的,例如用戶可以在 XDL 框架上應用基於 Tensorflow 或者 Pytorch 編寫的深度學習演算法。此外,對於已經在使用其它開源框架的企業或者個人用戶,也可以在原有系統基礎上進行擴展。
除了核心的 XDL 訓練框架外,阿里媽媽透露將全面開源面向高維稀疏數據場景的系統化解決方案,計劃分批次對外發布,包括面向在線實時服務的深度學習預估引擎、面向全庫實時檢索的深度學習匹配引擎;同時還內置阿里媽媽自主研發的一系列演算法,涉及 CTR 預估模型、CVR 預估模型、匹配召回模型、模型壓縮訓練演算法等等。
剩下的就是坐等代碼了!
—【完】—
BDTC 2018
精彩紛呈
2018 年12月6-8 日,由中國計算機學會主辦,CCF 大數據專家委員會承辦,CSDN、中科天璣數據科技股份有限公司協辦的 2018 中國大數據技術大會(BDTC 2018),將在北京新雲南皇冠假日酒店隆重舉行。
除 Keynote 外,主辦方精心策划了 13 場專題技術和行業論壇,涵蓋大數據分析與生態系統、深度學習、推薦系統、大數據安全與政策、大數據可視分析、精準醫療大數據、數據科學與大數據技術教育、資料庫、金融大數據、知識圖譜、工業大數據、區塊鏈、交通與旅遊大數據等主題。
※專訪英特爾AIPG全球研究負責人Casimir Wierzynski:物理學、隱私和大腦將根本性塑造AI
※AI助力清華博士進入周杰倫戰隊,預告AI應用迎來黃金時代?
TAG:AI科技大本營 |