10月機器學習開源項目Top10
作者 | Mybridge
譯者 | 林春眄
整理 | Jane
出品 | AI科技大本營
過去一個月里,我們對近 250 個機器學習開源項目進行了排名,並挑選出熱度前 10 的項目。這份清單的平均 github star 數量高達 1345,涵蓋了包括深度學習, Tensorflow, 圖像分割, 漫畫著色, 強化學習,Unity 等主題,希望你能從中找到一個你所感興趣的項目深入探究。
▌
Top 1 :fastai
fastai 庫由 fast.ai 研究團隊貢獻,使用當前最佳的實踐研究簡化了快速準確的神經網路訓練。你可以在 fastai 官網找到並使用它。fastai 庫是基於 fast.ai 團隊進行的深度學習最佳實踐研究,包括對視覺,文本,表格和協作(協同過濾)模型的支持,方便研究者直接使用。你可以在示例文件夾中找到有關示例,也可以參閱完整的文檔以便了解更詳細的使用說明。
?
?
Github 地址:
https://github.com/fastai/fastai?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
官網:
https://docs.fast.ai/
▌
Top 2:Deepvariant
Deepvariant 是由 Google 研究團隊貢獻的開源項目,通過運用深度神經網路來從下一代 DNA 序列數據中預測遺傳變異。它是基於 Python/C++ 的程序,尚且只支持 Python 2.7,並能夠在任何 unix 操作系統上運行。Deepvariant 具有高精度,強魯棒性,快速高效,靈活性強,易於使用等優點。
?
?
Github 地址:
https://github.com/google/deepvariant?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
▌
Top 3:Albumentations
Albumentations 是一個快速的圖像增強庫,它易於使用並封裝了其他一些圖像處理庫的功能。此外,它還具有如下特點:
基於高度優化的 opencv 的快速擴充
具有超級簡單但功能強大的使用界面,並廣泛適用於不用的任務,如分割,檢測等
易於定製
易於添加其他的框架,兼容性好
?
?
Github 地址:
https://github.com/albu/albumentations?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
▌
Top 4:MangaCraft
MangaCraft 是當前最佳的半自動化漫畫著色項目。
?
?
Github 地址:
https://github.com/lllyasviel/MangaCraft?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
參考視頻:
https://www.bilibili.com/video/av32698923/
▌
Top 5:Holodeck
Holodeck 是用於強化學習和機器人研究的模擬器,它具有高保真性。你可以訪問該項目所提供的用戶使用手冊,以便更加詳細的了解整個過程。
?
?
Github 地址:
https://github.com/byu-pccl/holodeck?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
使用手冊
https://holodeck.readthedocs.io/en/latest/
▌
Top 6:Petastorm
Petastorm 是 Uber ATG 研發的一個開源數據訪問庫。它可直接從 Apache Parquet格式的數據集中進行單機或分散式訓練,以及深度學習模型的評估。此外,Petastorm 還支持當前流行的基於 Python 的機器學習(ML)框架,如 Tensorflow,PyTorch 和PySpark,也可以通過純 Python 代碼來使用它。
?
?
Github 地址:
https://github.com/uber/petastorm?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
▌
Top 7:Ngx
Ngx 是一個基於神經網路的視覺生成器和混合器,能夠利用神經網路進行 VJing 過程。它將 pix2pix (使用 cGAN 的圖像到圖像轉換)作為 ad-hoc 的下一幀預測模型,使用從視頻剪輯中提取的成對連續幀數據進行反覆地訓練,以便模型能夠生成無限持續時間的圖像序列。此外,它還能夠混合(交叉淡化) 兩個 pix2pix 模型,這些模型會產生變化,並轉換為生成的視頻。
?
?
Gituhub 地址:
https://github.com/keijiro/Ngx?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
▌
Top 8:AlphaAI
AlphaAI 是一個使用無監督和監督學習進行股票預測的開源項目,通過堆疊神經網路的實現來預測股票的盈利值。它包含多個訓練組件,使用者可以通過調整替換各種組件組成以便模型獲得最佳的預測結果。
?
?
Gituhub 地址:
https://github.com/VivekPa/AlphaAI?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
▌
Top 9:Blueoil
Blueoil 是一個將深度學習應用於小型設備的開源項目。它能夠訓練一個神經網路,並將訓練好的模型轉化為可執行的二進位庫,以便通過 FPGA 進行加速。
?
?
?
Gituhub 地址:
https://github.com/blue-oil/blueoil?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
▌
Top 10:Tencent-ml-images
Tencent-ml-images 是包含當前最大的多標籤圖像資料庫(ml-images) 的開源項目,共由 11166 個圖像類別,17609752 張訓練圖像和 88739 哥驗證數據的URL 地址組成。此外,通過遷移學習,將ml-images 上預訓練好的ResNet-101 模型遷移到 ImageNet 資料庫上,能夠實現 80.73% 的 Top1 精度。
?
?
Gituhub 地址:
https://github.com/Tencent/tencent-ml-images?utm_source=mybridge&utm_medium=blog&utm_campaign=read_more
推薦閱讀
互聯網公司時尚穿搭指南
【資源】這本開放書籍幫你掃清通往ML的數學絆腳石
最強NLP預訓練模型!谷歌BERT橫掃11項NLP任務記錄
樸素貝葉斯詳解及中文輿情分析(附代碼實踐)
【代碼集合】深度強化學習Pytorch實現集錦
pandas入門教程
【資源】機器學習演算法工程師手冊(PDF下載)