建模數據科學家的福音:MIT系特徵自動構造工具今日發布
Root 編譯整理自TechCrunch & Feature Labs
量子位 報道 | 公眾號 QbitAI
建模數據科學家的活難度很大。
得洞察big data背後的本質,從海量複雜的原始數據中創建出有價值的特徵,才能搭建出高質有效的機器學習演算法。
而特徵的創建要求建模數據科學家有對數據有深入的了解、極端敏感的直覺、以及紮實的行業相關知識。
即便是老司機,現階段的人肉創建特徵,還是很耗時燒腦,也不可避免會出錯。
Feature Labs(特徵實驗室),這家打娘胎就在MIT的研究機構,致力於幫助數據科學家更快地構建機器學習演算法,於今天正式成立。
Max Kanter,Feature Labs的CEO兼聯合創始人,在接受TechCrunch採訪時表示,該公司已經開發出一種特徵自動構造的方法,幫助企業客戶搭建、跑通、以及最最最重要的部署給力的機器學習產品模型。
Max Kanter,Feature Labs的CEO兼聯合創始人
這套特徵自動構造工具,Kanter認為,是Feature Labs的王牌。
其中的「深度特徵合成」(Deep Feature Synthesis)數據處理流程,可以直接從原始的關係數據集和交易數據集中(例如網站訪問的用戶或光放購物車不買的人),自動創建出特徵,並自動轉化為具有預測意義的信息。
DFS的原理https://www.featurelabs.com/blog/deep-feature-synthesis/
這意味著,建模數據家花更少的時間,就能拿到以往掉頭髮熬通宵才能磨出來的特徵。節省出的時間和腦子,可以用來搞明白他們需要預測什麼信息,進一步改善產品模型。
特徵自動構造咋用?
想小試一下效果?
可以用Feature Labs給開發者提供的開源框架,Featuretools。針對新的機器學習問題,構建小型項目的演算法。
Featuretools使用指南https://docs.featuretools.com/#minute-quick-start
不過,如果想要擴大項目規模,就要購買Feature Labs提供的商用產品,有提供雲服務方案,也有提供本地解決方案提,具體看客戶的需求。
Feature Labs已經服務過的客戶有西班牙對外銀行(BBVA Bank),柯爾百貨(Kohl』s),NASA和美國國防部下屬的國防高級研究計劃局(DARPA)。
Feature Labs的前世 & 融資情況
2015年的時候,CEO Kanter在MIT計算機科學和人工智慧實驗室(CSAIL)工作。
之前提到的「深度特徵合成」演算法,就是他與老同學Kalyan Veeramachaneni、Ben Schreck在這段工作時間共同開發的。這演算法強大到,在全球三項數據科學競賽中pk掉了615個對手(總共有906個團隊)。
這成績吸引了200多家媒體的關注和報道。從中,他們看出了演算法建模的市場需求。在和100多家企業溝通後,他們發現現有的問題不是ML不起作用,而是企業不知道怎麼用ML。
根據這個現象,Kanter才有了打算,成立Feature Labs,並給企業幾點建議:
1)這套工具適合解決以前從未解決的業務問題;
2)用的數據集從來沒經過ML處理;
3)最重要的是,基於ML開發和部署的產品團隊得對機器學習完全陌生。
Feature Labs希望合作項目能在8周內,測試好實用性和可行性,並把解決方案部署到一線的生產環境中。
正是和大量應用端的接觸,和早期企業客戶的大量合作,Feature Labs才有了一定的積累,推出這套特徵自動構造的產品。
另外,Feature Labs還宣布,在去年3月份就拿到了150萬美元的種子融資,由Flybridge Capital Partners領投,First Star Ventures和122 West Ventures跟投。
最後,附編譯來源,
https://techcrunch.com/2018/02/22/feature-labs-launches-out-of-mit-to-speed-up-building-machine-learning-algorithms/
https://www.featurelabs.com/blog/launching-featurelabs/
—完—
加入社群
量子位AI社群13群開始招募啦,歡迎對AI感興趣的同學,加小助手微信qbitbot5入群;
此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。
進群請加小助手微信號qbitbot5,並務必備註相應群的關鍵詞~通過審核後我們將邀請進群。(專業群審核較嚴,敬請諒解)
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。
※馬斯克又一個宏偉藍圖即將啟動:衛星高速上網,沒有中間商賺差價
※前方記者李開復:達沃斯聚焦6大AI議題,中國AI+教育全球領先
TAG:量子位 |