當前位置:
首頁 > 知識 > 初學者須知:機器學習領域三條黃金定律

初學者須知:機器學習領域三條黃金定律

如果,你現在還是機器學習領域的門外漢,那你在學習過程中多少會有一些疑惑。雖然,機器學習處於技術領域的前沿,但對於不同背景和領域的開發人員來說很難趕上,開發人員應該怎麼做呢?

市面上已經出現了針對機器學習的培訓和課程,普遍價格不菲。今天,我們來看看Google Developers團隊提供的兩個有用工具:the Rules of ML和Machine Learning Glossary(ML規則和機器學習術語表)。對於從事機器學習的人來說,這是一個難以置信的豐富資源,無論是初學者還是僅為學習ML技能。

初學者須知:機器學習領域三條黃金定律

機器學習三條黃金定律

機器學習是一門相當新的學科,所以實際上並沒有太多硬性規定。但是,有很多指導方針和有用的概括可以遵循。

谷歌科學家Martin?Zinkevich認為,機器學習的規則和工具只是讓技術人員成為更棒的開發者,而不是機器學習專家。機器學習與工程有很大關係,而與演算法有關較少。這並不是說ML演算法不是必需的和有用的,只是作為開發人員,許多問題都可以通過工程或計算機科學的背景來解決。

Martin Zinkevich對所有ML問題都有一個非常基本的方法:

1.確保管道是堅實的端到端;

2.以合理的目標開始;

3.以簡單的方式添加基本功能;

4.確保管道保持穩定。

遵循這種方法涵蓋了很多理由,日益增加的複雜性意味著你正在為未來製造障礙。記住所有開發項目的法則——保持簡單和愚蠢。在開始ML管道之前有三條簡單的黃金法則:

初學者須知:機器學習領域三條黃金定律

規則1:不要害怕在沒有機器學習的情況下推出產品

你需要機器學習嗎?你真的需要嗎?毫無疑問,機器學習現在技術上非常酷,非常熱門,但不要讓它成為問題的唯一解決方案。機器學習具有非常明確的成功參數,它可能無法滿足您的項目需求,或者並不適合。

此外,根據定義,機器學習需要大量數據。您可能無法訪問正確的數據集,甚至無法訪問任何數據集。

規則2:設計和實施指標

指標非常重要。沒有測量依據,你怎麼知道項目是否有效?你怎麼能確定是否有問題?這是數據收集的起點。當你設計一個項目時,應該嘗試是否可以從一開始就收集數據,從一開始收集更容易獲得用戶許可。擁有豐富的歷史數據可以更容易地證明,機器學習的應用實際上對系統產生了哪些影響。

現在也是投資一個體面的存儲系統的好時機,用於收集想要的所有數據。

規則3:選擇複雜的啟發式機器學習

啟發式是解決問題的方法。簡單的啟發式演算法很容易實現,複雜的就不那麼容易了。機器學習比複雜的啟發式更容易更新。

初學者須知:機器學習領域三條黃金定律

谷歌發布Machine Learning Glossary(機器學習辭彙表)

Google開發團隊發布了全面的機器學習辭彙表。 技術術語多半比較複雜,谷歌用一張非常有用的參考表(辭彙表官方地址:https://developers.google.com/machine-learning/glossary/ 可能無法直接訪問,可以Github上直接搜索Machine Learning Glossary)來簡化名稱,這些參考表清楚地解釋了我們所說的cross-entropy, one-hot encoding和a softmax。

坦率地說,我覺得這非常有用,因為計算機科學中存在很多重疊術語。清晰度對於編寫乾淨的代碼至關重要。編寫乾淨的代碼不僅有效, 它有助於未來的開發者繼續學習更新。

結論

機器學習可能很困難,但是有很多選項可以讓初學者更容易。這些來自谷歌開發團隊的工具對於初學者以及希望提高ML技能的人來說都非常有用。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 IT168企業級 的精彩文章:

填補國內空白!首個數據資產評估中心成立
天下三分分久必合 未來資料庫或將只有一個

TAG:IT168企業級 |