當前位置:
首頁 > 知識 > 五個常用的機器學習項目!

五個常用的機器學習項目!

經過一段時間的中斷後,這些「忽視……」的帖子在本月捲土重來,繼續進行適度的探索,以努力將難以應付的、鮮為人知的機器學習項目帶給那些額外關注的目光。

對於一些潛在的、新的機器學習方法,請看以下的5個項目。

1. skift: 用於Python fastText 的scikit-learn 包裝器

https://github.com/shaypal5/skift?spm=a2c4e.11153959.blogcont471549.11.41c915ceFxAFIo

什麼是 skift?

skift包括幾個scikit-learn兼容包裝器,用於fasttext Python包,以適配這些用例。

什麼是fastText?

fasttext是為了有效的學習詞語表示和語句分類的一個庫。

fasttext只適用於文本數據,這意味著它將只使用一個單列,而這個單列來源於一個可能包含許多不同類型的特徵列的數據集。例如,一個常見的用例是有個fasttext分類器,使用一個單列作為輸入,並忽略其他的列。特別是當fasttext被用來作為在層疊分類器中的一個分類器的時候,和其它分類器一樣使用非文本特徵。

明白了fasttext是難題的重要一部分,但是一旦掌握了這種認識,skift幫助你輕鬆實現fasttext,一般來說也會把它與其它scikit-learn功能整合到一起。

2. PHP-ML: 用於PHP的機器學習庫

https://github.com/php-ai/php-ml?spm=a2c4e.11153959.blogcont471549.13.41c915ceFxAFIo

厭煩了沒有用於PHP合適的機器學習替代品?你是一個受虐狂嗎(如果你使用PHP,這本身就是答案)?那麼,這個項目可能就是給你的!

PHP中機器學習的新途徑。演算法、交叉驗證、神經網路、預處理、特徵提取,盡在一個庫。

當我還是個孩子的時候,我遠離了PHP世界,不知道這是否有任何特殊的、迫切的需求;絕對可能有!除此之外,我一直對如何在不同編程語言環境中開展機器學習生態系統感興趣。也許你也是,或者更重要的是,你實際上可能會使用一個看起來很初級的東西,作為 PHP開發者在機器學習方面一個有強有力的庫。

3. Keras Scikit-Learn API 包裝器

https://keras.io/scikit-learn-api/?spm=a2c4e.11153959.blogcont471549.14.41c915ceFxAFIo

雖然這在技術上不是它自己的項目,但我發現它重要的足以在這裡表現的很突出。

通過在keras.wrappers.scikit_learn.py找到的包裝器,你可以使用序列keras模型(僅是單輸入)作為你的Scikit-Learn學習工作流。

類似於如何理解skift(以上所示)的基礎項目是最重要的,這個難題的重要部分是用Keras來理解實現神經網路,本身就是一個高層次的API。能夠將Keras與其它scikit-learn功能整合在一起,並能夠使用熟悉的API和方法,正是這些包裝器完成的。在官方keras GitHub庫中找到的API。

如果你已經使用了Keras,這有一個很好的機會,不過對你來說已經不是新的了。如果你還沒用,知道這種整合是可能的,那就足夠讓你看一看了。

4. CatBoost: 基於決策樹梯度提升的機器學習方法

https://github.com/catboost/catboost?spm=a2c4e.11153959.blogcont471549.16.41c915ceFxAFIo

梯度增強仍然是所有的瘋狂。或者是一些瘋狂,至少吧。一個最新進入梯度提高樹舞台上的是CatBoost。

CatBoost的主要優勢:

卓越的品質,與其它GBDT的庫相比;

最好的推導速度;

支持數字和分類特徵;

高速的GPU和多GPU(在一個節點上),以支持訓練;

數據可視化工具;

Catboost在Python,R,還有命令行介面類型的語言中是可用的。點擊這裡查看教程,以及更多的完整文檔

5. PyMC3: Python中的概率編程

https://github.com/pymc-devs/pymc3?spm=a2c4e.11153959.blogcont471549.19.41c915ceFxAFIo

PyMC3是一個Python開發包,用於致力於先進的馬爾可夫連鎖蒙特卡洛擬合演算法和變分的樸素貝葉斯統計模型和基於概率的機器學習。它的靈活性和可擴展性使它可應用於一大類的問題。

PyMC3 基於西雅娜項目,提供了:

計算優化與動態C編譯;

NumPy廣播和高級索引;

線性代數運算符;

簡單的可擴展性;

關於更多的,你可以查閱入門指南和 API快速入門指南。

原文:https://www.kdnuggets.com/2018/02/5-machine-learning-projects-overlook-feb-2018.html?spm=a2c4e.11153959.blogcont471549.26.41c915ceFxAFIo

推薦《深度學習系列課》


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 AI講堂 的精彩文章:

Keras】基於SegNet和U-Net的遙感圖像語義分割
深度強化學習聊天機器人!

TAG:AI講堂 |