機器學習2.0時代:用自動化AI幹掉一大票專家
目前,當企業想用機器學習解決問題時,他們往往需要一個團隊。即使是一個非常簡單的問題,也需要多位數據科學家、機器學習專家以及領域專家共同商定優先事項並交換數據和信息。
這個過程往往效率低下,需要數月時間才能獲得結果。並且這也只能解決當下的問題。下一次再出現問題時,企業必須重複上述過程。
麻省理工學院(MIT)的一群研究人員想知道,「如果我們嘗試另一種策略會怎麼樣?如果我們創建自動化工具,讓主題專家能夠使用機器學習自己解決這些問題呢?」
過去五年,MIT信息與決策系統實驗室首席研究科學家Kalyan Veeramachaneni與Max Kanter以及Ben Schreck為應用機器學習設計嚴格的範例。Schreck與Veeramachaneni是MIT的同學,後來一起創立了機器學習初創企業Feature Labs。
該團隊首先將整個過程劃分為一組離散的步驟。例如,一個步驟涉及搜索具有預測能力的埋藏模式,稱為「特徵工程」。另一個步驟稱為「模型選擇」,其中從許多可用選項中選擇最佳建模技術。然後他們自動執行這些步驟,發布開源工具以幫助領域專家有效地完成這些工作。
在 「機器學習2.0:工程數據驅動的AI產品」 論文中,該團隊彙集了這些自動化工具,將原始數據轉化為可靠的、可部署的模型。這種自動化鏈讓主題專家,甚至那些沒有數據科學經驗的專家,都可以使用機器學習來解決業務問題。
Schreck說,「通過自動化,機器學習2.0讓主題專家可以將更多時間花在真正需要其領域專業知識的步驟上,比如決定首先解決哪些問題並評估預測如何影響業務成果。」
去年,Accenture加入MIT和Feature Labs團隊開展一個雄心勃勃的項目,通過開發和部署機器學習模型來構建人工智慧項目經理,該模型可以提前預測關鍵問題,並增強軟體行業經驗豐富的人力資源項目經理。
這是一個測試機器學習2.0自動化工具Featuretools的機會,Featuretools是一個由DARPA的模型數據驅動發現(D3M)項目資助的開源庫,用於處理現實世界的問題。
Veeramachaneni和他的同事們每一步都與Accenture的領域專家密切合作,從找出要解決的最佳問題到通過一系列強有力的測試。該團隊構建的第一個模型是根據大量的交付指標來預測軟體項目的性能。測試完成後發現,該模型可以正確預測80%以上的項目績效結果。
使用Featuretools涉及一系列人機交互。在這種情況下,Featuretools首先向領域專家推薦了40000個功能。接下來,人類利用他們的專業知識將這個列表縮小到100個最有希望的特徵,然後他們開始訓練機器學習演算法。
接下來,領域專家使用該軟體來模擬使用該模型,並測試新的實時數據如何工作。該方法還擴展了典型的「訓練-測試驗證」協議,以適應當代機器學習 研究,使其更適用於在現實世界使用。隨後該模型部署,每周對數百個項目進行預測。
Accenture全球技術官Sanjeev Vohra說,「我們希望將機器學習應用於我們在技術服務業務中面臨的關鍵問題,更具體地說,我們希望親自看看MIT的機器學習2.0是否有助於預測軟體交付中的潛在風險。事實上我們對結果非常滿意,並將廣泛分享,以便其他人也能從中受益。」
在另一份聯合論文「人工智慧項目經理」中,團隊逐步了解他們如何使用機器學習2.0範例來實現快速準確的預測。
Veeramachaneni說:「20年來,將機器學習應用於解決問題的任務一直是作為一個研究或可行性項目,或者是一個發現的機會。藉助這些新的自動化工具,現在可以從原始數據創建機器學習模型,並在幾周內就能用上它們。」
該團隊打算繼續完善機器學習2.0,以解決儘可能多的行業問題。「這是大眾化機器學習背後的真正想法。我們希望讓機器學習對廣大人群有用。」他補充道。
在接下來的五年中,我們很可能會看到機器學習2.0的採用有所增加。「隨著勢頭的增強,開發人員將能夠像建立資料庫一樣建立機器學習設備,」Feature Labs首席執行官Max Kanter說。「這將變的很簡單。」
※醫學界新突破!通過機器學習技術可準確地預測腎臟的生存時間
※Science:機器學習成功挑戰交叉偶聯反應
TAG:機器學習 |