當前位置:
首頁 > 知識 > 六大頂級機器學習項目:讓機器學習也可以自動化!

六大頂級機器學習項目:讓機器學習也可以自動化!

由於項目需要,調整機器學習演算法和模型的工作並不能總由專家完成。畢竟,很多企業並不擁有這方面的專家,機器學習的力量是有代價的。即便擁有技能、工具包、硬體和數據,創建和微調機器學習模型仍然存在複雜性。

但是,如果機器學習的全部要點是使以前需要人類掌握的任務自動化,是不是可以使用機器學習將一些工作從機器學習本身脫離出來呢?答案是肯定的,在「自動化機器學習」或AML下,一系列技術可以減少準備模型所需的工作,並逐步完善以提高其準確性。

六大頂級機器學習項目:讓機器學習也可以自動化!

自動機器學習仍處於初期階段,它被實現為一大堆不同的技術,被快速塑造成一般業務用戶而不是機器學習專家。

以下是六種領先的自動化機器學習工具:

  • Auto-sklearn和Auto-Weka

很多自動化機器學習已都廣泛使用Scikit-learn項目,這是一套通用的機器學習功能形式。

Scikit-learn提供了幾種不同的「estimator」功能或用於從數據中學習的方法。因為選擇正確的estimator是困難的,Auto-sklearn項目旨在消除一些這樣的困擾。它提供了一個通用estimator函數,進行分析以確定給定Scikit-learn任務的最佳演算法和超參數集。

Auto-sklearn仍然需要一些手動干預。最終用戶需要對調整過程可以使用的內存和時間設置限制。但是,做出這些選擇很容易,讓機器決定其餘的時間,而不是修改模型選擇和超參數。

對於使用Java的機器學習者和Weka機器學習包,有一個類似的項目叫做Auto-Weka。Auto-sklearn實際上是Auto-Weka的延伸。

  • Prodigy

創建監督學習模型是一個勞動密集型工作,如自然語言處理。人類必須手工創建元數據來描述或注釋模型使用的數據,至少整個過程還沒有完全自動化。然而,有可能使用機器學習來加快整個過程,使人力勞動變得更少。

這是一個名為Prodigy的注釋工具,它使用Web界面使訓練過程儘可能快速和直觀地反映需要注釋數據集的模型。已經添加到數據集中的注釋用於指導未來注釋,有助於加快注釋過程。

Prodigy使用Python作為機器學習環境,它提供用於培訓模型的Python模塊,測試探索注釋數據集以及在項目之間管理結果。完成的模型可以導出為Python包,並通過其他Python應用程序直接放入生產。

  • H2o Driverless AI

另一個旨在使機器學習更適合非專家級用戶的產品是H2o Driverless AI。H2o Driverless AI設計用於熟悉Tableau等產品的業務用戶,他們希望從數據中獲得洞察力,而無需學習機器學習演算法的內容。

像Prodigy一樣,H2o Driverless AI使用基於Web的UI。這裡用戶選擇數據集中的一個或多個目標變數來解決,並且系統提供答案。結果通過互動式圖表呈現,並用簡體中文的注釋解釋。

與Prodigy不同,H2o Driverless AI是專有產品。H2o.ai的大部分堆棧是開源的,但是這個特定組件不是。一個跡象表明,商業產品而不是開源棧可能是將機器學習帶到非技術用戶的主要方法。

  • Google的AutoML和Vizier

近幾個月來,Google公布了自己的兩個項目,儘管完全是內部項目。第一個項目「AutoML」是為了自動化多層次深度學習模型的設計而創建的。Google表示,設計網路的過程通常需要大量時間和實驗,具有重要的機器學習專長。AutoML使用強化學習演算法來測試數千種可能的網路,而不是讓人類嘗試一個又一個深度學習的網路設計。可以使用演算法每次運行的反饋來為下一次運行創建新的候選架構。通過足夠的運行,培訓機制可以確定哪些模型結構產生更好的結果。

另一項Google項目由Google Vizier發表,是一項「black-box 優化服務」。這是一種找到系統最佳運行參數的方法,在提供的參數和結果之間相關聯。

根據這篇文章,Google使用Vizier研究通過調整自己的行為來改善服務。示例包括「調整用戶界面參數(如字體和縮略圖大小,顏色模式和間距)或流量服務參數,例如各信號在確定向用戶顯示哪些項目時的相對重要性。

現在,Vizier只適用於Google內部使用。但是,希望Google最終能夠提供產品版本的服務,甚至將其作為開源項目發布。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 IT168企業級 的精彩文章:

顏值即正義!佳能、米域跨界打造辦公室里的攝影展
PaaS和SaaS之間的中間架構,詳細後端即服務(BaaS)
雲視全連接:科達正式發布視訊混合雲

TAG:IT168企業級 |