10款必備神器:機器學習開源工具助你從新手到高手
新智元報道
來源:hackernoon
編輯:元子
【新智元導讀】從事機器學習方面的工作,不會用工具將極大的阻礙工作效率。但現在工具那麼多,我們該如何選擇呢?本文針對非開發者、模型部署、NLP、語音、視覺、強化學習、數據挖掘等多個不同人群,提供了10個必須掌握的模型。
在廈門人工智慧峰會上,依圖科技聯合創始人、CEO朱瓏介紹到短短的5年時間機器的演算法水平又提升了100萬倍!過去或許只能從1萬人中識別出1個人,後來發展到1000萬、1億、10億甚至20億人中識別出這個人!與此同時,算力方面提升了10萬倍。從過去用1萬量級規模的數據做訓練,到百萬規模的數據做訓練,到現在用10億的數據集做訓練,又提升了1萬倍!
我們已經深刻的體會到,人工智慧的飛速增長刺激了當今就業市場對機器學習技能的巨大需求。機器學習社區現在非常活躍,各種開源工具層出不窮,讓人有點目不暇接,有點不知道該如何選擇。那麼本篇將為你介紹10個最應該了解的機器學習開源工具,走起!
非開發者應該用什麼?
不會開發,不會編程,也能用機器學習?答案是可以的,只要你會用工具。這裡為初學者推薦兩個工具:
Knime
Knime是一款出色的工具,可讓你無需編寫任何代碼即可完成端到端的數據科學工作流程。
它甚至配備了一個拖放式界面,UI清晰,操作簡單直觀,可以說是懶人福音了。
操作起來非常簡單,首先使用該工具進行數據收集和轉換;完成後,你可以創建一個模型並將其可視化。在生產方面,你可以部署和管理數據科學項目。
最後,你可以通過使用Knime生成洞察來利用你的實現。
官網:
https://www.knime.com/
Uber Ludwig
Uber Ludwig是另一款適合初學者的優秀工具。有了它,你可以快速測試和訓練深度學習模型。用戶可以選擇啟用懶人模式(拖拽界面),或者直接操作代碼。
使用起來比Knime稍微複雜一點點。需要先載入CSV文件來訓練數據。通過使用預先訓練的模型,你可以預測輸出目標。最後,你可以使用可用的可視化選項可視化你的數據。
如果你是編程的初學者,你還可以在Python中使用他們擴展的API和訓練模型。
GitHub地址:
https://uber.github.io/ludwig/user_guide/
模型部署用什麼工具?
模型部署是機器學習的關鍵方面之一。為了幫助你完成此過程,這裡列出了幾個工具。
TensorFlow.js
TensorFlow.js允許你直接從Web構建和部署機器學習模型。它使用JavaScript在Web上運行。
你也可以使用Node.js。有了它,你不僅可以運行現有模型,還可以重新訓練現有模型。
它提供了直觀的API,允許你使用JavaScript構建和訓練模型,在Web瀏覽器上也是如此。
如果你想在移動設備上進行開發,還可以查看TensorFlow Lite。
官方地址:
https://www.tensorflow.org/js/
MLFlow
MLFlow讓你可以解決端到端的機器學習生命周期問題。它有三個主要組件。
MLflow跟蹤 - 通過記錄和比較結果和參數來處理實驗
MLflow項目 - 允許你將項目打包成其他成員的可重用表單
MLflow模型 - 幫助你在不同平台中部署和管理ML庫
MLFlow的另一個驚人功能是它與庫無關。這意味著你可以將其與其他機器學習庫一起使用而不會出現任何兼容性問題。為了實現library-agonistic行為,它使用REST API和CLI。
官方地址:
https://github.com/databricks/mlflow
NLP、計算機視覺和音頻用什麼工具?
還有其他方便的工具可用於在機器學習中執行不同的操作。
Detectron
如果你正在尋找最先進的物體檢測演算法,那麼你可以使用Detectron。
它由Facebook開發,是AI Research軟體系統的一部分。它利用Caffe2深度學習框架和Python。
官方地址:
https://github.com/facebookresearch/Detectron
SimpleCV
SimpleCV,一個開源框架,允許你構建計算機視覺應用程序。它類似於OpenCV,使你可以訪問高級計算機視覺庫。這意味著你不必擔心錯綜複雜的概念。
有了它,你可以製作計算機視覺項目,而無需在基礎知識上投入太多時間。畢竟,出於某種原因,它被命名為SimpleCV。
官方地址:
http://simplecv.org/
Tesseract OCR
Tesseract OCR是一款功能強大的光學字元識別軟體,可讓你識別語言。
它支持100多種語言,也可以編程識別新語言。
官方地址:
https://github.com/tesseract-ocr/tesseract
強化學慣用什麼工具?
如果你想訓練智能代理,那麼你需要幫助強化學習。
Open AI Gym
Open AI Gym讓你訓練你的智能體做幾乎任何事情,包括散步,玩遊戲等等。它藉助易於使用的強化學習任務套件來實現。
官方地址:
https://gym.openai.com/
Unity ML Agents
Unity ML Agents是Unity提供的開源統一插件,讓你開發可在遊戲中使用的智能體。
官方網址:
https://unity3d.com/machine-learninghttps://unity3d.com/machine-learning
數據挖掘用什麼工具?
如果你希望收集數據科學項目的數據,可以使用以下工具。
Weka
Weka用於數據挖掘任務。它藉助於為數據挖掘設計的機器學習演算法來實現。有了它,你可以找到很多東西,包括分類,準備,回歸,聚類,可視化和關聯規則挖掘。
該項目是開源的,使用GNU許可。
官方網址:
http://www.cs.waikato.ac.nz/ml/weka/
結論
機器學習正在改變我們與世界互動的方式。它使我們的生活更輕鬆,並確保我們建立一個未來世界。
那麼你還有更好的工具推薦嗎?歡迎留言。
![](https://pic.pimg.tw/zzuyanan/1488615166-1259157397.png)
![](https://pic.pimg.tw/zzuyanan/1482887990-2595557020.jpg)
※《新星世》新書發布:超智能賽博格將成人類最終救贖
※10億美元賭註:OpenAI稱5年後AI有望達到人腦水平
TAG:新智元 |