沒有三年實戰經驗,我是如何在谷歌雲專業數據工程師認證中通關的
谷歌雲平台為構建數據處理系統提供了基礎架構,掌握谷歌雲的使用可以在簡歷上起到錦上添花的效果。那麼,如何在簡歷上證明「我學過」呢?當然是考證啦!所謂「證多不壓身」。本文作者詳述了自己考取谷歌雲專業數據工程師認證的通關歷程,還附贈了一些通關秘籍……
註:本文專用於2019年3月29日前的谷歌雲專業數據工程師認證考試。此後我也做了一些更新,放在了Extras的部分。
在過去的幾個月里,我一直在Google Cloud學習課程並準備專業數據工程師考試。然後我順利通過了。幾周後,我的連帽衫到了,證書也到手了。
本文將列出讀者想知道的一些事,以及我為獲取Google Cloud專業數據工程師認證所採取的行動步驟。
為什麼要進行Google Cloud專業數據工程師認證?
數據無處不在。而且,我們需要知道如何構建能夠處理和利用數據的系統。Google Cloud提供了構建這些系統的基礎架構。
你可能已經掌握了使用Google Cloud的技能,但如何向未來的僱主或客戶證明這一點呢?兩種方式:通過項目或認證。
證書能夠幫你告訴未來的客戶和僱主,「嘿,我已經掌握了技能,並且我也努力獲得了認證。」
谷歌用一句話對此進行了總結。
展示你在Google Cloud平台上設計和構建數據處理系統以及創建機器學習模型的能力。
如果你還不具備這些技能,那麼通過認證的學習材料,你將學習如何在Google Cloud上構建世界一流的數據處理系統。
誰需要獲得Google Cloud專業數據工程師認證?
你已經看到這些數字了。「雲」正在擴增。它就在這裡。如果你還沒有看到這些數字,請相信它正在擴增。
如果你已經是一名數據科學家、數據工程師、數據分析師、機器學習工程師或正在尋找進入數據世界的職業,Google Cloud專業數據工程師認證就非常適合你。能夠熟練使用雲技術對所有類型的數據來說都是至關重要的。
你是否需要證書才能成為優秀的數據工程師/數據科學家/機器學習工程師?
並不是。
沒有證書你也可以使用Google Cloud尋求數據解決方案。
證書只是對現有技能的驗證。
參加認證考試需要多少錢?
參加認證考試的費用為200美元。如果失敗,需要再次支付考試費。
準備課程和使用平台本身都有成本。
平台費用是使用Google Cloud服務的費用。如果你是它的發燒友,你會很清楚這些。如果你只閱讀了本文中的培訓材料,那麼你可以創建一個新的Google Cloud帳戶,並在Google提供的300美元信用額度內完成註冊。
我們會馬上講到課程費用。
證書的有效期為多久?
2年。 之後需要再次參加考試。
而且Google Cloud每天都在不斷發展,因此證書所需要的內容可能會發生變化(我在開始撰寫本文時也發現了這一點)。
你需要為考試做什麼準備?
Google建議有3年以上行業經驗和1年以上使用GCP設計和管理解決方案的人員參加專業認證。
我沒有這些經歷和經驗,我只準備了半年時間。
為了彌補這一塊的不足,我充分利用了在線培訓資源。
我參加了哪些課程?
如果你像我一樣沒有達到谷歌建議的要求,可能需要學習以下課程來提高自己的技能。
以下課程是我用於準備認證的課程,按完成順序排列。我列出了通過認證考試的費用、時間表和實用值。
這是一些令人獲益匪淺的在線學習資源,我過去常用它們備戰考試。依次是A Cloud Guru、Linux Academy、Coursera。
Cousera網站上的Google Cloud平台專業數據工程課
鏈接:http://bit.ly/courseraGoogleDataEng
費用:每月49美元(7天免費試用)
時間: 1-2個月,每周10個小時以上
實用值: 8/10
Coursera上的Google Cloud平台專業數據工程課是Coursera與Google Cloud合作完成的。
它有五個子課程,每個課程都需要每周10個小時的學習時間。
如果你不熟悉Google Cloud上的數據處理,那這門課算是領你入門。你將使用名為QwikLabs的迭代平台進行一系列實踐練習。在此之前,將由Google Cloud從業者講授如何使用Google BigQuery、Cloud Dataproc、Dataflow和Bigtable等不同的項目。
Cloud Guru上關於谷歌雲平台的介紹
鏈接:https://acloud.guru/learn/gcp-101
費用:免費
時間: 1周,4-6小時
實用值: 4/10
不要認為這門課實用值低就沒用。遠非如此。得分較低的唯一原因是它沒有專註於專業數據工程師認證(從標題可以看出)。
在完成Coursera專業化課程後,我將此作為複習課程,因為我只在一些特定的時候使用過Google Cloud。
如果你來自其他雲服務提供商,或之前從未使用過Google Cloud,你可能需要參加此課程。它對Google Cloud平台做了精彩的介紹。
Linux Academy Google認證專業數據工程
鏈接:https://linuxacademy.com/google-cloud-platform/training/course/name/google-cloud-data-engineer
費用:每月49美元(7天免費試用)
時間: 1-4周,每周4小時以上
實用值:10/10
在完成考試並回顧我所完成的課程後,Linux Academy的Google認證專業數據工程課對我是最有幫助的。
課程視頻以及 Data Dossier的電子書(https://www.lucidchart.com/documents/view/0ca44a63-4ea4-4d78-8367-2465512d21be/1)(課程附帶的免費學習資源)和練習考試使這個課程成為我用過的最好的學習資源之一。
我甚至在考試後在給後團隊的Slack筆記中推選它為首選課程。
零散筆記
? 考試中的某些內容不在Linux Academy或A Cloud Guru或Google Cloud Practice考試中(預計)
? 出現一個有數據點圖表的問題,你需要用公式對它們進行聚類(例如cos(X) 或 X2+Y2)
? 必須了解Dataflow、Dataproc、Datastore、Bigtable、BigQuery、Pub/Sub之間的區別,以及如何使用它們
? 考試中的兩個案例研究與實踐中的案例完全相同,但我在考試期間根本沒有閱讀這些研究(這些問題可見一斑)
? 了解一些基本的SQL查詢語法非常有用,特別是對於BigQuery問題而言
? Linux Academy和GCP提供的練習考試與考試的真題非常相似,我會做大量模擬練習,找到自己的短板
? 幫助記憶Dataproc的打油詩:「Dataproc the croc and Hadoop the elephant plan to Spark a fire and cook a Hive of Pigs」
? 「Dataflow 是流動的光束」(Dataflow聯想Apache Beam)
? 「世界各地的人都可以參與到ACID wash Spanner的製作。」(Cloud Spanner是一款專為雲計算而設計的資料庫,兼容ACID且可在全球範圍內使用)
? 大致了解一些相關和非相關的資料庫選項(例如MongoDB,Cassandra)的曾用名
? 每個服務的IAM功能略有不同,但了解如何將用戶從可以看見數據與可以設計工作流分離開來是有益處的(例如,Dataflow Worker可以設計工作流,但不能查看數據)
這可能已經足夠了。每次考試內容可能會有出入。但Linux Academy的課程會提供80%的知識。
Google Cloud 1分鐘視頻
鏈接:https://www.youtube.com/playlist?list=PLIivdWyY5sqIij_cgINUHZDMnGjVx3rxi
費用:免費
時間: 1-2小時
實用值: 5/10
這些是在A Cloud Guru論壇上推薦的。其中許多內容與專業數據工程師認證無關,但我選擇了一些我認可的課程。
在學習課程時,有些服務看起來很複雜,所以花一分鐘聽完對一些特定服務的描述還是很值得的。
準備雲專業數據工程師考試
鏈接:http://bit.ly/preparingforGCPDataExam
費用:有證書49美元,無證書免費
時間:1-2周,每周6小時以上
實用值:N / A.
我在考試前一天找到了這個資源。由於時間限制,我沒有參與,因此缺乏實用值的的評分。
但是,在瀏覽課程概述頁面後,我發現這個資源很不錯,可以將你在Google Cloud上學習的數據工程內容綜合起來,並發現你的短板。
我把這門課程作為參考資料發給了一位正在準備認證考試的同事。
Maverick Lin的谷歌數據工程秘籍
鏈接:https://github.com/ml874/Data-Engineering-on-GCP-Cheatsheet
費用:免費
時間:N / A.
實用值:N / A.
這是我在考試後偶然發現的另一個資源。我看了一下,這份資源全面又簡潔。另外,它是免費的。這可以在練習考試間歇將其當做補充讀物,甚至可以在認證之後用來回顧。
課程結束後的事宜
在快要完成課程後,我提前一周預約了考試。
畢竟deadline是第一生產力,可以讓你充分了解你所學到的知識。
我多次參加了Linux Academy和Google Cloud的練習考試,每次都能達到95%以上的準確率。
首次以90%以上的成績通過Linux Academy練習考試。
每個平台的測驗都很相似,但我發現,複習出錯的題並記錄下出錯原因能有效地幫我查漏補缺。
我在Google Cloud上進行的考試以設計數據處理系統為主題,進行了兩個案例的研究(自2019年3月29日後這一形式發生變化)。整個過程多是選擇題。
我花了大約2個小時。並且比我參加的任何一次練習考試都要困難20%。
所以我反覆強調的模擬考試還是非常重要的。
如果再考一次,我會改變什麼?
更多練習模擬考試。學習更實用的知識。
當然,你可以做更多的準備工作。
谷歌建議考生有GCP的3年以上使用經驗。但我缺少這一經驗,所以我必須從我擁有的部分下手。
附註
考試於3月29日更新。本文中的材料仍將為你提供良好的基礎,但要及時注意到內容的變化。
Google Cloud專業數據工程師考試的不同部分(版本1)
1. 設計數據處理系統
2. 構建和維護數據結構和資料庫
3. 分析數據並實現機器學習
4. 為分析和優化建模
5. 確保可靠性
6. 可視化數據和提議策略
7. 考慮安全性和合理性
Google Cloud Professional數據工程師考試的不同部分(第2版)
1. 設計數據處理系統
2. 構建和運行數據處理系統
3. 實現機器學習模型(大部分改變都在這裡) [新]
4. 確保解決方案質量
版本2將版本1的第1、2、4和6合併為1和2。它還將版本1的第5和第7部分合併到第4部分。第2版的第3部分已經擴展到包含所有Google Cloud的新機器學習功能。
由於最近考試內容改變,許多訓練資料都沒來得及更新。
但是,本文提到的材料能覆蓋70%的內容。我將結合自身對以下內容做一些研究(這些在考試的第2版中介紹過)。
- Google機器學習(ML)API
- Google Cloud 機器學習引擎
- Google Cloud TPU(Google專為ML培訓而構建的自定義硬體)
- Google ML術語表
最新的考試更新主要集中在Google Cloud的ML功能上。
2019年4月29日更新:來自Linux Academy課程講師Matthew Ulasien的消息:
僅供參考,我們計劃更新Linux Academy的數據工程師課程,以應對從5月中旬開始的新方案。
考試結束後
完成考試後,你只會收到通過或失敗兩種結果。我建議考試成績至少達到70,因此我練習考試時的目標至少是90。
一旦通過,你將收到一封電子郵件,裡邊有官方Google Cloud專業數據工程師證書的兌換代碼。恭喜!
你還可以在Google Cloud專業數據工程師商店中使用兌換代碼。可以兌換T恤,背包和連帽衫(庫存可能會變)。我選擇了連帽衫。
現在你已經通過認證,可以(正式地)展示你的技能,繼續做你最擅長的事情了。
記得兩年後要獲得重新認證。
※OpenAI「假新聞」生成器GPT-2的最簡Python實現
※僅用200個樣本就能得到當前最佳結果:手寫字元識別新模型TextCaps
TAG:機器之心 |