當前位置:
首頁 > 最新 > Python超過R,成為數據科學和機器學習的最常用語言

Python超過R,成為數據科學和機器學習的最常用語言

陳樺 編譯自 KDnuggets

量子位 報道 | 公眾號 QbitAI

近期,數據挖掘資訊網站KDnuggets開展了一項調查,問題是「2016年和2017年,在數據分析、數據科學和機器學習工作中,你使用R、Python、兩者都用,還是其他工具?」

對954名受訪者的調查顯示,Python尚未完全「吞噬」R,但2017年Python生態系統已經超越了R,成為數據分析、數據科學和機器學習領域領先的平台,同時也在迅速吸引其他平台的用戶。

2016年,Python排名第二(「主要使用Python」佔比為34%,「主要使用R」佔比為42%),而在2017年的結果中,Python和R的佔比分別為41%和36%。

在KDnuggets的讀者中,同時使用R和Python的比例也從2016年的8.5%上升至2017年的12%,而使用其他工具的比例從16%下降至11%。

2016年和2017年,在分析、數據科學、機器學習中,使用Python、R、兩者都用、其他工具的份額

隨後,我們可以看看用戶在不同平台之間的轉移。

從2016到2017年,用戶在Python、R、兩者都用、其他工具間的轉移情況

上圖看起來有些複雜,但我們可以專註於兩個關鍵方面。Python在這兩個方面都保持領先。

忠誠度:Python用戶的忠誠度更高。2016年,Python用戶中的91%仍然繼續使用Python。而在R的用戶中,這一比例只有74%,在其他平台中只有60%。

轉移比例:大約10%的R用戶轉移至Python,但只有5%的Python用戶轉移至R。在2016年同時使用兩種工具的用戶中,只有49%仍然同時使用兩者,而38%轉而主要使用Python,只有11%轉而主要使用R。

接下來,我們來看看最近幾年的變化趨勢。

2014年到2017年,Python、R和其他平台份額的變化

可以看到,R的份額正在緩慢下降(從2015年的約50%下降至2017年的約36%),而Python的份額則穩步上升,從2014年的23%上升至2017年的47%。其他平台的份額也在緩慢下降。

在2015年關於R和Python的調查中,我們沒有提供「同時使用Python和R」的選項。因此為了比較過去4年的數據,我們將2016年和2017年Python和R的份額按照如下公式來計算:

Python總份額 = (Python份額) + 50%(同時使用Python和R的份額)

R總份額 = (R份額) + 50%(同時使用Python和R的份額)

最後,讓我們看看各地區的趨勢和模式。參與調查的用戶來自各地區比例如下:

美國/加拿大:40%

歐洲:35%

亞洲:12.5%

拉美:6.2%

非洲/中東:3.6%

澳大利亞/紐西蘭:3.1%

為了簡化表格,對於「同時使用R和Python」的份額,我們以同上的方式進行處理,並將亞洲、澳大利亞/紐西蘭、拉美,以及中東/非洲合併為「其他」地區。

2016、2017年,Python、R、其他工具在各地區的使用情況

在這3大地區中,我們觀察到同樣的模式:

Python的份額上升8%到10%。

R的份額下降2%到4%。

其他平台的份額下降5%到7%。

Python用戶的未來看起來很光明,但我們認為,考慮到當前用戶數規模龐大,R和其他平台仍將在可預見的未來保持一定的份額。

加入社群

量子位AI社群8群開始招募啦,歡迎對AI感興趣的同學,加小助手微信qbitbot2入群;

此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。

進群請加小助手微信號qbitbot2,並務必備註相應群的關鍵詞~通過審核後我們將邀請進群。(專業群審核較嚴,敬請諒解)

誠摯招聘

量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。

量子位QbitAI

? ? ? 追蹤AI技術和產品新動態


點擊展開全文

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器學習 的精彩文章:

博士團隊帶您入門機器學習,課程大優惠,限額30人,趕快上車啦!!!
機器學習(6)之樸素貝葉斯NB及實例
這家AI公司,要用機器學習建成Facebook類的知識平台
Google App再度改版,利用機器學習推送個性化Feed服務
通過一個 Kaggle 實例學習解決機器學習問題

TAG:機器學習 |

您可能感興趣

最新調查:Python 成數據分析、數據科學與機器學習的第一大語言
機器學習和數據科學最常用到的TOP10演算法
數據科學Python基礎
python轉型數據分析、機器學習、人工智慧學習路線
Kaggle 推出四門免費線上課程:機器學習、R語言、數據可視化、深度學習
Python數據預處理:使用Dask和Numba並行化加速
Jupyter Notebook數據科學高效技巧!
從零開始學習 Python之數據結構
數據科學家效率提升必備技巧之Jupyter Notebook篇
數據科學之路為什麼一定要用Python
使用Pandas&NumPy進行數據清洗的6大常用方法
TalkingData:曝光iPhoneX真實在用量數據
NumPy 將停止支持 Python 2,這裡有一份給數據科學家的 Python 3 使用指導
學界 | 最大規模數據集、最優圖像識別準確率!Facebook利用hashtag解決訓練數據難題
給數據科學家的 Python 3 指導;簡單 chatbot 代碼實現
除了Facebook和Intel,還有誰在數據中心使用OCP設備?
Facebook暫停數據分析公司CubeYou的運營、NASA正在通過機器學習搜索遠程行星的望遠鏡數據
Women in Data Science Beijing:與數據科學的美妙邂逅
Plotly Dash數據可視化
成為搶手的數據科學家最應具備的技能?先學Python准沒錯