年薪30~60萬,機器學習演算法工程師必備能力項
來源:AI科技大本營
2018 年,人工智慧在各行各業中的落地應用越來越多。十多年前,所有的企業都在想辦法互聯網化,如今,所有的互聯網企業都在試圖 AI 化。
技術的競爭歸根結底表現為人才的競爭,毫無疑問 AI 工程師是 IT 行業需求缺口最大的高端技術崗位,薪資水平雖遠高於其他行業,但 AI 工程師依然供不應求。
除了高校里科班出身的相關專業畢業生,有代碼經驗的轉型程序員也廣受 AI 公司的歡迎。
據招聘網站的數據統計顯示,最高薪酬的 56 個崗位 ( 分為:60-100 萬、100 萬 + ;兩檔 ) ,要求碩士以上學歷的崗位有 30個,比例 53%,比 AI 工程師中碩士學歷要求的平均比例 28.6%,高出一倍。
對於 AI 相關的技術崗位,30 萬 - 60 萬年薪基本上是比較主流的收入水平,相較於其他技術崗位,基本上是 8 年以上工作經驗的架構師的收入水平。
圖片來源:騰訊科技
目前也被稱之為機器學習演算法工程師最好的時代,各行業的需求都非常旺盛。典型的領域包括以下幾個細分行業:
推薦系統:解決海量數據場景下信息高效匹配分發的問題。無論是候選集召回,還是結果排序,以及用戶畫像等方面,機器學習都起著重要的作用。
廣告系統:和推薦系統相類似,但也有顯著的差異,需要在考慮平台和用戶之外,同時考慮廣告主的利益,兩方變成了三方,使得一些問題變得更加複雜。
搜索系統:搜索系統的基礎建設和上層排序方面,均大量使用了機器學習技術。在網站和 App 中,搜索是非常重要的流量入口,因此,機器學習對搜索系統的優化會將對整個網站產生直接的影響。
風控系統:互聯網金融風控是近年來興起的機器學習的又一重要戰場。運用機器學習的能力可以很大程度上決定一家互聯網金融企業的風控能力,而企業風控能力又是其業務保障的核心競爭力。
所謂 「工資越高,責任越大」 ,企業對於演算法工程師的要求也在逐漸提高。因此,營長就來聊聊機器學習演算法工程師的學習與成長路線,並給出一些學習的建議和資料。
機器學習演算法工程師必備的能力項
成為一名合格的開發工程師不是一件簡單的事情,需要掌握從開發到調試到優化等一系列能力,其中每一項都需要足夠的努力和經驗才能夠掌握。
想要成為一名合格的機器學習演算法工程師(以下簡稱演算法工程師)更是難上加難,這需要在掌握工程師的通用技能以外,還要掌握一張不算小的機器學習演算法知識網路。
圖:CSDN《 AI 技術人才成長路線圖 V1.0 》
下面,我們就將如何成為一名合格的演算法工程師所需的技能進行拆分,一起來探究需要掌握哪些技能,才能算是一名合格的演算法工程師。
01:基礎開發能力
所謂演算法工程師,首先需要是一名工程師,那麼就要掌握所有開發工程師都需要掌握的一些能力。在多數企業的職位中,演算法工程師需要負責從:「演算法設計到演算法實現再到演算法上線」,這一個全流程的工作。
02:概率和統計基礎
概率和統計可以說是機器學習領域的基石之一,從某個角度來看,機器學習可以看作是:建立在概率思維之上的,一種對不確定世界的系統性思考和認知方式。
學會用概率的視角看待問題,用概率的語言描述問題,是深入理解和熟練運用機器學習技術的最重要基礎之一。
在統計方面,一些常用的參數估計方法也需要掌握,典型的如最大似然估計、最大後驗估計、EM 演算法等。
這些理論和最優化理論一樣,都是可以應用於所有模型的理論,是基礎中的基礎。
這些分布貫穿著機器學習的各種模型之中,也存在於互聯網和真實世界的各種數據之中,理解了數據的分布,才能知道該對它們做什麼樣的處理。
03:開發語言和開發工具
近年來, Python 可以說是數據科學和演算法領域最火的語言,主要原因是它使用門檻低,上手容易,具有著完備的工具生態圈,同時各種平台對其支持也比較好。
但是在模型訓練方面,有一些更加專註的工具可以給出更好的訓練精度和性能,典型的如 LibSVM、Liblinear、XGBoost 等。
大數據工具方面,目前離線計算的主流工具仍然是 Hadoop 和 Spark,實時計算方面 Spark Streaming 和 Storm 也是比較主流的選擇。
04:機器學習理論(最重要)
雖然現在開箱即用的開源工具包越來越多,但並不意味著演算法工程師就可以忽略機器學習基礎理論的學習和掌握。這樣做主要有兩方面的意義:
掌握理論才能對各種工具、技巧靈活應用,而不是只會照搬套用。只有在這個基礎上才能夠真正具備搭建一套機器學習系統的能力,並對其進行持續優化。
否則只能算是機器學習搬磚工人,算不得合格的工程師。出了問題也不會解決,更談不上對系統做優化。
學習機器學習的基礎理論的目的不僅僅是學會如何構建機器學習系統,更重要的是,這些基礎理論裡面體現的是一套思想和思維模式,其內涵包括概率性思維、矩陣化思維、最優化思維等多個子領域,這一套思維模式對於在當今這個大數據時代做數據的處理、分析和建模是非常有幫助的。
如果你腦子裡沒有這套思維,面對大數據環境還在用老一套非概率的、標量式的思維去思考問題,那麼思考的效率和深度都會非常受限。
點擊下方「閱讀原文」了解【人工智慧伺服器】
↓↓↓