當前位置:
首頁 > 科技 > 如何用 SQL 的方式打開 Pandas?

如何用 SQL 的方式打開 Pandas?

作者 | 王偉同學

責編 | 郭芮

Pandas是一個非常方便的數據處理、數據分析的類庫,也是每個Pythoner 做數據分析必備的神器。但不可否認的是,不是所有的程序員都會Python,也不是所有的Pythoner都會使用Pandas。

不過好消息是,藉助於pandassql,你可以使用SQL來操作DataFrame。

基礎

pandasql 中的主要函數是 sqldf,它接收兩個參數:

一個SQL 查詢語句;

一組會話/環境變數(locals() 或 globals())。

為了方便起見,我們可以定義一個函數來方便我們調用。

接下來我們導入一些數據。

查詢

pandassql 使用的語法是 SQLite 的語法。任何 DataFrame 都會被 pandassql 自動檢測到,你可以將它們作為來查詢。

限定條數

先來看下如何去限定數據條數。這裡來獲取下前兩條數據。

除了可以限定從頭開始的前N條數據外,我們還可以設置偏移量。這裡來獲取下從第二行開始的前兩條數據。

限定欄位

既然是SQL,我們當然可以限定查詢時的所需欄位了。這裡我們限定只獲取指定的births欄位。

排序

排序功能也是非常常見的,pandassql 完美支持。這裡我們按照 date 降序,births 升序來排。

限定查詢條件

我們可以指定 where 來查詢滿足要求的數據。這裡我們篩選出 turkey 不為空並且 date 在 1974-12-31 之後的數據。

聚合

數據分析時,聚合必不可少,pandassql 當然也支持了。這裡我們按照年份來分組,然後對 births 求和、求均值、求最大值以及求最小值。

關聯

關聯也是非常常見的操作。這裡我們根據欄位 date 作為條件來關聯 meat 和 births 這兩個DataFrame。

以上是我列舉的一些常用功能,除了這些之外,PandasSQL 還支持更多操作,都是基於 SQLite 的語法來完成的,感興趣的話可以自己研究。

聲明:本文為公眾號 AI派 投稿,版權歸對方所有。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 CSDN 的精彩文章:

如何在 15 分鐘內構建一個無伺服器服務?
蘇寧入局區塊鏈;山東用阿里的AI抓違建;印度擬讓蘋果退網

TAG:CSDN |