Postgres中更好的資料庫遷移
原文: http://www.craigkerstiens.com/2017/09/10/better-postgres-migrations/
作者:Craig Kerstiens
譯者:夜風輕揚
譯者註:在Postgres中進行資料庫遷移時會遇到哪些問題?如何解決它們?請見下文。
隨著資料庫的增長與擴展,你需要對一些操作給予更多的關注。你可能沒有完全意識到,在開發環境中執行應用程序時,執行某些操作的成本,與在生產環境中大相徑庭。在某一時刻,我們中的大多數人都犯了錯,在5分鐘時開始運行一些遷移,過15分鐘仍然在運行,突然間生產流量受到了影響。
有兩種操作發生的很頻繁,每種操作都有一些簡單的方法可以減少停機時間。讓我們看看每一個操作,它們是如何工作的,以及如何以更安全的方式來處理它們。
添加新列在Postgres中添加一個新列實際上代價是很低的。當你這樣做的時候,它會更新對於已有列時刻的跟蹤,它幾乎是瞬時的。當對某個列有一些約束時,這一部分就會變得很昂貴。一個約束可以是一個主鍵或者外鍵,或者是一些唯一性約束。 Postgres不得不掃描表中的所有記錄以確保沒有違反這些約束。添加諸如「非空」等一些約束時,可能會有一些違反,但這不是最常見的原因。
造成添加新列遲緩最常見的原因是大部分的框架中為新列設置預設值太過簡單。對於所有的新記錄這是一回事,但是對於已有的表來說,這意味著資料庫不得不要讀取所有的記錄並且向這些記錄中重寫新的預設值。對於只有幾百條記錄的表來說,這還不算太糟,但是對於上千萬條記錄的表來說,這時間就無法容忍了 。
簡而言之,在添加新列時,如果將其設為非空或者在創建是設置一個預設值都會給你帶來麻煩。解決之道是不要這樣做。但是,如果你需要一個預設值或者不想欄位為空時該怎麼辦。這有一些你可以採取的簡單步驟,將你的遷移工作從一步分為 四步:
1. 添加新列,允許其為空
2. 開始在所有新記錄和更新中寫入默認值
3. 逐步回填預設值
4. 應用你的約束
是的,只是稍微多一點工作,對現有工作的影響很微小。
索引類似大部分的DDL操作,創建索引時會加鎖,這就意味著所有新的數據必須等待索引創建完成後才可以寫入。對於新建的或者小規模的表,等待的時間不是很明顯,但是對於大規模資料庫,等待的時間可能是以分鐘甚至小時計添加索引的本意是為了提高查詢速度,但是實際的效果卻是降低了速度,這真是有點諷刺。
Postgres中對於這個問題的答案是 CONCURRENT 創建索引。就是在後台逐步創建索引。你可以通過:CREATE INDEX CONCURRENTLY語句並發創建索引。一旦創建了索引,只要你做想做的事情,Postgres就會在查詢中使用它。
可以提供幫助的工具這是一個不錯的實踐活動,了解運行遷移時會發生什麼,以及對於性能的影響。即便如此,你也不必只憑自己的力量去管理這些。至少對於Rails還有工具能幫組你掌握它。Strong migrations能夠幫組你掌握很多這些昂貴的操作,如果你在使用Rails,你可以考慮看一看。
還要其他的工具和秘訣可以有助於Postgres中的數據遷移?給我留言,我會把它們加到列表中。
2017年9月23日,SDCC 2017之區塊鏈技術實戰線上峰會正式召開,邀請圈內頂尖的佈道師、技術專家和技術引領者,共同探討區塊鏈技術棧架構與性能(架構與跨鏈操作)、智能合約安全、分層評測區塊鏈項目難點與策略、貼近雲計算的下一代區塊鏈平台、區塊鏈+AI等熱門話題與技術。更有區塊鏈技術在互聯網公司的成功應用經驗,七位大牛與你相聚狂歡,詳情查看所有嘉賓和議題,以及註冊參會。
※來自 Underminer 工作室的虛擬現實優化建議
※Nightdive 通過虛擬途徑為老遊戲營造光明的未來
※Pixeldash 工作室的多樣化成功之路
※VRMonkey 提供的虛擬現實用戶體驗技巧
※亞馬遜AWS聯手AMD,共同打造大型圖像處理雲平台
TAG:CSDN |