AutoML破解深度學習寒冬論,夏粉教小白5分鐘搞定機器學習建模
克雷格 新智元 今天
新智元報道
作者:克雷格
【新智元導讀】昨天,國內AutoML領域創業公司智鈾科技發布了自動化機器學習產品「小智」,據公開數據顯示,這是國內首款可私有部署的AutoML商用產品。新智元創始人楊靜女士作為特邀嘉賓,在智鈾科技產品發布會上對AI軟硬體發展現狀和趨勢以及AutoML應用做了主題演講。
「AI寒冬」論調不減,但AI軟硬體能力增長卻是不爭的事實。
OpenAI發布的數據顯示,自2012年以來,AI計算力每3.5個月增長一倍,六年間這個指標已經增長了30萬倍以上。
同時,AMD也在上周展示了全球首款7納米製程的GPU晶元原型,顯示硬體能力依舊與摩爾定律賽跑。
在這樣的大背景下,數據挖掘和自動化建模等企業級服務迎來了巨大的市場空間,AutoML的出現則讓企業能迅速投入AI應用而不過度依賴數據科學家,同時也解決了傳統企業AI人才匱乏、人力成本高、時間成本高等問題。
昨天,國內AutoML領域創業公司智鈾科技發布了自動化機器學習產品「小智」,據公開數據顯示,這是國內首款可私有部署的AutoML商用產品。新智元創始人楊靜女士作為特邀嘉賓,在智鈾科技產品發布會上對AI軟硬體發展現狀和趨勢以及AutoML應用做了主題演講。
AI算力6年增長30萬倍,軟硬體能力增長破除深度學習「寒冬論」
最近,計算機視覺專家 Filip Piekniewski 的《AI Winter is Well on its Way》文章刷屏,認為深度學習的熱度已經大大下降,AI寒冬將至。
「深度學習是否有天花板?」楊靜在《讓機器學習更智能》演講中問道。目前,包括人臉識別或者語音識別,準確率已經達到了98%、99%的水平,「那剩下的1%、2%的話,是不是說可改進的空間比較小了?」
新智元創始人兼CEO楊靜女士
UC伯克利大學教授馬毅最近也發微博稱,越來越多的證據表明,通過擬合數據得到的深度神經網路模型(在classification,detection,segmentation等)對輸入很小的數值擾動和很小的變換deformation(甚至平移)都是不穩定的(unstable),更談不上魯棒。
所以目前基於深度學習的「人工智慧」,用在不痛不癢的應用上,也就罷了。把這樣的模型用在嚴肅的問題上(例如需要有安全、隱私、可靠性保障的),應該是十分危險的。
楊靜認為,過去幾年深度學習的確出現了一個爆發的情況,但是未來,特別是到2020年是否還會有這樣的一個爆發的增長速度呢?所以質疑深度學習的言論就出來了。
不過,從學術界到產業界的努力都在讓深度學習保持持續的爆發力。
OpenAI最近發布的一份關於AI計算能力增長趨勢的分析報告顯示,自2012年以來,AI訓練中所使用的計算力每3.5個月增長一倍,自2012年以來,這個指標已經增長了30萬倍以上,這遠遠超過摩爾定律的增長。這種突飛猛進的速度讓深度學習以及機器學習充滿著無限的可能,充滿了爆發性的增速。
硬體方面,AMD在上周展示了全球首款7納米製程的GPU晶元原型,含有32GB的高帶寬內存,專為人工智慧和深度學習設計。楊靜認為,AI相關的硬體有非常高速度的成長,因此說其實深度學習本身的發展速度的確是比摩爾定更快。
數據挖掘和自動化建模:企業級服務市場爆發機會
AI軟硬體能力增長速度為企業級的數據挖掘和自動化建模等雲服務帶來了巨大的市場空間,亞馬遜、微軟、谷歌等公司在企業級雲服務都有特彆強大的機器學習方面的支撐。
IDC的分析指出,人工智慧硬體、軟體企業級市場規模供未來幾年會有四五倍的提升,目前可以看到的是,在AI雲市場上亞馬遜現在佔了40%多的份額,微軟和Google緊隨其後。
Google在AI雲服務市場上異軍突起,在於它在AI雲服務方面提供了全新的軟硬體一體化的解決方案。
這個方案包括TPU、TensotFlow和AutoML,這種三位一體的組合形成了谷歌在企業級雲軟硬體的巨大優勢。
楊靜指出,對於中國企業來講,開源框架和AI晶元方面都很薄弱,但AutoML真正是一個空白和機會。「我們就像中國缺少晶元一樣,我們也缺開源框架,也缺自動化機器學習的自己的演算法,但我們在AutoML這方面,我覺得至少智鈾科技是非常值得期待的一支黑馬。」
與此同時,機器學習目前嚴重依賴數據科學家,並且面臨人才匱乏、人力成本高、時間成本高等問題,企業對無監督或者自主的學習的需求日益旺盛。
清華大學計算機科學與技術系副教授朱軍認為,這是機器學習研究人員讓技術推向產業要解決的一個關鍵的問題。「Alpha Zero是一個比較正面的例子,像在環境規則有限、能夠明確表達的時候,可以通過自主學習來增強它的能力。」
智鈾發布國內首款AutoML商用產品,AI小白5分鐘搞定機器學習建模
智鈾科技在昨天發布了AutoML產品「小智」。
AutoML 的概念源自2012年學術界提出一個新觀念——Programming by Optimization(PbO),字面上的意思是指以最優化程序開發,實質上就是要解決編程時人工調校參數的問題。
與谷歌Cloud AutoML專註於圖像識別領域不同,智鈾科技目前主要以結構化數據為主,致力於為企業帶來全流程、自動化的建模和部署能力,開發了自動化機器學習產品「小智」幫助企業構建人工智慧核心,實現AI驅動。
智鈾科技CEO夏粉博士畢業於中科院自動化所,擁有超過15年機器學習領域的研究和應用經驗,曾在百度任資深科學家,負責百度超大規模機器學習團隊。(新智元此前曾獨家報道智鈾科技融資情況)
智鈾科技是少數幾個掌握AutoML的公司,有以下幾方面技術優勢:
數據處理。
獨創重要性採樣技術,選擇1% 樣本就能達到90%隨機樣本效果。參數學習。
獨創參數搜索演算法,解決人工調參費時耗力的問題。模型演算法。
模型演算法優化:千層模型演算法,LR收斂速度提升60%;FGBDT演算法比XGBoost既快又好;
大規模神經網路:支持千億樣本、遷移特徵數據量,模型從千層到深層靈活支持,可建立萬億鏈接神經網路結構DNN。
特徵學習。
獨創特徵工程演算法:組合特徵挖掘效率提升上千倍,豐富的高階特徵提取方式;支持從無標籤數據中提取有效特徵。
此次智鈾發布的產品「小智」,可以自動構建高精度模型,為用戶提供從數據預處理、特徵工程、模型調參、模型評估、模型預測到結果分析等一站式服務。
除了以獨創的演算法實現了自動建模,小智在產品的交互方面也貫徹著簡單易用的原則,直觀的web界面允許任何人和小智進行交互,不需要AI背景,用戶也可以一鍵完成建模,內置的可視化效果,如ROC曲線圖和準確&召回曲線,能夠使用戶對自己的業務有更深刻的理解。據夏粉介紹:「在通用場景下,普通業務人員藉助小智也能達到高級建模人員水平。」
據悉,小智將以產品的形式提供給行業,除了支持公有雲、SAAS模式外,還提供私有化部署。
※DeepMind提出關係RNN:構建關係推理模塊,強化學習利器
※GAN正在成為新的深度學習
TAG:新智元 |