當前位置:
首頁 > 最新 > 3步將深度學習應用到你的商業中

3步將深度學習應用到你的商業中

原文標題:Here"s how you can leverge Deep Learning in your bussiness

翻譯:申利彬

校對:白靜

作者:George Seif

本文約2000字,建議閱讀5分鐘。

本文帶大家三步了解深度學習在商業中的應用方法。

深度學習是大家談論的熱門話題,利用深度學習不僅解決了很多現實難題,還讓很多新的創新成為可能。強有力的盈利商業模式正是以給人們解決問題、為客戶帶來價值為基礎的。

深度學習在很多任務上表現的很好,例如,語音識別、圖像分類、聊天機器人,等等。但是,我們該怎樣使用這種技術?如何把它應用在自己的商業中呢?下面我會指導你如何做到,並用流程圖直觀表達這個過程。

第一步:獲取數據

深度學習融入商業的第一步是獲取極其重要的數據。深度學習發揮作用,能夠很好解決有價值的問題,主要歸功於數據。最好的深度學習模型是基於監督學習,也就是說,這些模型達到很好的性能需要大量標記數據。簡而言之,我們需要給深度學習「機器」很多「燃料」,它才能很好的工作,這種「燃料」就是數據。

告訴你一個好消息,大多數情況下數據都是現成的。有很多公開可用的標記數據集,這些數據集被收集起來用於訓練深度學習模型,再應用到普通的應用程序。有很多關於圖像分類、語言翻譯、聊天機器人、自動駕駛的數據,可以用在應用程序上。

這是深度學習數據集的快速學習資源:

http://bit.do/Deep-Learning-Datasets(資料很全,值得收藏)

假如你遇到不常見的情形,有個特定的應用,很具體,但是沒有公開的大數據集,該怎麼辦呢?我們可以製作自己的數據集,數據收集不再像以前那麼具有挑戰性。在這種情況下,網路爬蟲工具可以發揮絕佳作用。Adrian Rosebrock有一個很好的教程,關於如何自動爬取Google圖片並建立自己的數據集。

http://bit.do/Scrape-Your-Dataset. (教程地址)

可以用群智工具標記大量數據,例如,亞馬遜的Mechanical Turk,它的目標是獲取足夠的數據,建立一個極簡可用的產品 (MVP)。

你肯定好奇,到底需要多少數據。這兒有一個不錯的方法可以做出估計:找一個相似的任務,看看別人處理問題用了多少數據。除此之外,通常情況下數據越多越好,只要你不是得到負反饋。

第二步:開發深度學習產品

有了標記數據,可以全力開發產品。使用之前的數據訓練深度學習模型,並用該模型完成特定任務,最終給客戶帶來價值。深度學習最擅長處理那些重複的任務,這些任務呈現出多種多樣的模式。因此需要關注在必要知識和執行方面重複率都很高的自動化任務,通常情況下這些任務還需要大量人類努力或特定技能。這樣,你把提供給客戶的價值最大化,如果客戶不使用你的深度學習產品,那就不能享受到這些價值。

第三步:客戶驅動的正反饋循環

在這個階段,通過幾個關鍵步驟把深度學習應用在商業中。你已經收集了數據並用它來訓練一個深度學習模型,然後用這個模型助力產品,產品性能表現很好並給客戶帶來價值。現在是最重要的部分,正反饋循環。

開始把產品交付客戶使用,有的客戶喜歡用,也有的不喜歡,但這都是一個學習過程。非常重要的是,一個新的客戶也就是一個新的數據來源,它可以進一步提高深度學習模型的準確率,進而優化產品。所以,關鍵是有效率的獲取新數據。

第一次開發一個極簡可用的產品(MVP)時,你可能會為你的定製產品使用公開的數據集或自己爬取數據集,不管是哪種情況,你的數據都足夠訓練一個好的模型並開發出MVP。但如果想優化產品,數據可能是不夠的。比如,你使用了公開的數據集,這些數據可能不包含特殊場景。你可能在家裡安裝了人臉識別系統,系統識別出人臉時才會把門打開。如果你使用的數據集只有清晰的人臉圖片,那系統可能會在雨天或者晚上失效,顧客也就會被鎖在門外。另一種情況是你自己爬取數據集,你的目標是獲得足夠數據,開發出一款極簡可用產品(MVP)。這兩種情況都表明:更多的數據有可能優化你的模型。也有研究證明,更多的數據有助於改進深度學習模型:

https://arxiv.org/abs/1707.02968v2(論文地址)

既然你的產品掌握在付費客戶手中,那麼他們就是你獲取新數據的最佳資源。客戶會定期使用產品,這樣就可以獲得更多的數據。還記得那個在雨中人臉識別失敗的例子嗎?為什麼不把這些失敗的數據加入訓練集,幫助訓練提高深度學習模型的精度!可以收集那些在雨中和夜晚失敗的數據,並標記它們,用這些新數據優化模型。每當系統出錯,就有得到新數據的機會,標記這些新數據,重新訓練模型,可以實現從錯誤中學習。當然。也可以在成功的數據中運用這些方法,收集數據並使模型在那些情況下的表現更加穩定。

整個流程創造了正反饋循環,顧客就是驅動循環的人。數據越多,產品越好。產品越好,客戶越多,客戶創造更多有價值的數據助力深度學習產品。

結束語

現在了解了整個流程,可以開發一個產品,既能實現自我防禦,還能由連續循環的數據和深度學習驅動,給客戶帶來巨大的價值。

原文地址:https://towardsdatascience.com/heres-how-to-leverage-deep-learning-in-your-startup-9204666a3272

申利彬,研究生在讀,主要研究方向大數據機器學習。目前在學習深度學習在NLP上的應用,希望在THU數據派平台與愛好大數據的朋友一起學習進步。

轉載須知

如需轉載,請在開篇顯著位置註明作者和出處(轉自:數據派ID:datapi),並在文章結尾放置數據派醒目二維碼。有原創標識文章,請發送【文章名稱-待授權公眾號名稱及ID】至聯繫郵箱,申請白名單授權並按要求編輯。

發布後請將鏈接反饋至聯繫郵箱(見下方)。未經許可的轉載以及改編者,我們將依法追究其法律責任。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 THU數據派 的精彩文章:

清醒話AI:為你分析技術可行性及未來趨勢

TAG:THU數據派 |