像Excel一樣使用R進行數據分析
Excel是數據分析中最常用的工具,本篇文章通過R與excel的功能對比介紹如何使用R通過函數式編程完成excel中的數據處理及分析工作。我們總結出最常用的50個函數,通過這些函數介紹如何通過R完成數據生成和導入,數據清洗,預處理,以及最常見的數據篩選,回歸預測和假設檢驗等最常見的操作 。
本系列文章共分為三篇10個部分。已由人民郵電出版社出版,感興趣的朋友可以在非同步社區獲取完整版。
這是第三篇,介紹最後三部分內容,數據統計,相關分析,回歸預測及假設檢驗,數據導出。
8,數據統計
第八部分為數據統計,這裡主要介紹描述統計,標準差,協方差和相關係數的使用方法。
8.1. 描述統計
Excel中的數據分析中提供了描述統計的功能。R中可以通過summary對數據進行描述統計。
summary函數是進行描述統計的函數,自動生成數據的數量,均值,標準差等數據。下面的代碼中對數據表進行描述統計。
#數據表描述統計 summary(df)
#特定列描述統計 summary(df$age)
8.2. 計數,求和,均值
還有一些常見的計算函數,如計數,求和和計算均值等等。
#數據表計數(列數) length(df) [1] 12#特定列計數 length(df$id) [1] 8#求和 sum(df$price) [1] 24483#均值 mean(df$price) [1] 3060.3758.3. 方差,標準差
R中的var函數用來接算特定數據列的方差。
std函數用來接算特定數據列的標準差。
#標準差 sd(df$price) [1] 1443.244
將以上常用的數值計算設置成自定義函數,可以一次計算出想要的結果。
#自定義函數對數據表特定列進行統計 data_summary
※什麼是SSL預證書?
※點融網 CTO 孔令欣:區塊鏈應用的普及取決於行業的頭部公司
※用戶個人行為報告思考:報告的價值與設計
※使用govanityurls讓私有代碼倉庫中的go包支持go get
※首次創業慘敗!融資不成、孤單一人,21 歲創業者深度反思
TAG:推酷 |
※Python數據處理實戰——使用Scikit-Learn進行多類文本分類
※使用Excel進行時間管理
※使用Apache的ab進行壓力測試
※使用pdb進行Python調試
※利用Python進行數據分析之數據規整化
※pandas創始人手把手教你利用Python進行數據分析
※face-api.js中加入MTCNN:進一步支持使用JS實時進行人臉跟蹤和識別
※使用Pandas&NumPy進行數據清洗的6大常用方法
※Excel-VBA進行文字替換數值
※使用 VS Code 進行 Python 編程
※NET Core使用swagger進行API介面文檔管理
※XRP支持者推出XRP Symbol項目 對其Unicode符號進行標識開源
※Memcache伺服器可被利用進行大規模DDoS攻擊
※全球唯一白金版 Rolex Daytona 即將進行拍賣
※用PowerBI圖表進行時間序列預測分析
※利用Chan-Vese模型和Sobel運算對重疊葉片進行圖像分割
※開發出CRISPRdisco軟體,對CRISPR/Cas系統進行鑒別和分類
※官網進行大規模發售!BAPE x adidas Dame 4開賣信息再次確認!
※對愈加流行的Qrypter RAT運作情況進行分析
※【網路研討會】通過PowerVR圖形內核引入PVRTune Complete進行性能分析