原來,你是這樣的R語言
更多騰訊海量技術文章,請關注云加社區:https://cloud.tencent.com/developer/column
作者:CDA數據分析師
今天給大家介紹一款在開源世界裡集萬千寵愛於一身的軟體——R語言。
有多受寵呢?簡單說,你能想到的地方都有它的身影。
做學術?看看R在各大語言排名系統的表現
O" reilly media在過去幾年中進行了一系列數據科學調查,分析了數據科學趨勢。在2016年的調查報告中,R語言是最常用的編程語言(如果排除SQL的話,在本文中它不能稱為編程語言)。57%的調查人群使用R語言(使用Python的比例為54%)。
此外還有TIOBE指數(按搜索引擎搜索次數對編程語言進行排名)。在TIOBE指數上,R語言十年來呈現出穩定上升趨勢。
找工作?看看使用R語言的公司
在招聘數據科學家的幾家頂級公司中,R語言使用程度非常高。諸如國外的Google和Facebook 、Microsoft,國內騰訊、京東、微軟等公司都有使用R語言數據科學家。R語言的市場招聘需求也非常旺盛。(以下為獵聘網搜索結果)
聽講座?看看每年舉行R大會的陣容
2017年,是中國R會議值得紀念的第十個年頭。
賣了這麼久關子,那麼R到底是個啥?我們為什麼要用它呢?且聽我慢慢道來。
R語言是什麼?
這個問題相信不用我多說了,簡單粗暴的說:R 是一個有著統計分析功能及強大作圖功能的軟體系統。我們一般使用R-Studio作為它的編輯環境。
認識一種語言,我們要從它的歷史說起。
那就得先從另一款語言S談起,(嗨不是你們腦海里的大S,小S啦!)S語言是由 AT&T貝爾實驗室John Chambers等人開發的一種用來統計編程的語言。S語言目前有兩種實現版本,一種是現在由TIBCO經營的商業軟體 S-plus, 另一種就是免費開源的R語言。
1992年,Auckland大學的Robert Gentleman 和 Ross Ihaka 為了能夠更有效地開展大學裡的統計入門課程的教學,他倆決定引入S語言來開發一套軟體,1994年該軟體最初版本基本成型。這就是後來我們用到的R的雛形啦。
(對,這就是它的爸爸們啦,這下知道我們的明星語言為什麼要姓R了吧)
為什麼要使用R語言?
1. 物美價廉——作圖顏值高,且完全免費
說它物美,主要是指它卓越的作圖功能。
可以說,點圖線圖柱狀圖直方圖,R語言樣樣精通,而且設計感滿滿,絕對可以在這個看臉的世界裡獨擋一面。比如你可以畫這樣的圖:
如果對R中基本圖形稍作修飾,你還能畫成這樣:
還能這樣(上海地區工商銀行分布核密度圖):
2. 兼收並蓄——演算法覆蓋廣,擴展易
作為統計分析工具,它幾乎覆蓋整個統計領域的前沿演算法。
從火到根本停不下來的的神經網路(就是那隻下圍棋的機器狗腦袋裡的東西),到經典了一百多年還熠熠生輝的基礎回歸,數千個R包,上萬種演算法,你都能找到可直接調用的函數實現。
3. 軟體擴展易
作為一款軟體系統,它有極方便的擴展性。你的數據原來存在Oracle 里?沒問題,輕鬆導入;你的數據在MySQL 里?沒問題, 照樣解決。文本文件、資料庫管理系統,統計軟體,專門的數據倉庫都可兼容。它同樣可以將數據輸出並寫入到這些系統中。
同時它還可以輕鬆於各種語言完成互調,比如大數據系統Hadoop,商業軟體SPSS、SPSS Modeler,你曾經愛的python,都可無縫對接。
4. 集千萬力量於一身——強大的社區支持
作為一個開源軟體,R背後有一個強大的社區和大量的開放源碼支持,獲取幫助非常容易。
比如國外比較活躍的社區有GitHub和 Stack Overflow等,通常R包的開發者會先將代碼放到GitHub,接受世界各地的使用者提出問題,修改代碼等操作,等代碼成熟後再放到CRAN上發布;
而Stack Overflow 則是一個優質的IT技術問答網站,當你在Google上搜索R問題時,通常會看到該網站的回答會排在首位,足可見該網站的搜索熱度有多高!
而國內如經管之家論壇-五區 【R語言論壇】等都是優秀的R語言社區。
R還有什麼神奇的技能?
知乎一名用戶的回答,我覺得挺有意思。
男票也喜歡R,於是有一天,他忽然屁顛屁顛跑來告訴我, 寶寶你知不知道R裡面有一個package,會不停的誇你^o^
我0.0
這個package叫praise, 於是就是 >>>praise( ) you are awesome >>>praise( ) you are outstanding
R還能充當PS,開發小遊戲,總之,更多的精彩等你來發掘!
R是一種用於分析數據的領域特定語言。如果你之前未接觸過專業的分析軟體,那麼R是不錯的選擇。
※從零開始理解雲計算 Vol.2:雲計算的分類
※用神經網路玩史萊姆排球
TAG:雲加社區 |