當前位置:
首頁 > 科技 > 深度學習,先跟上再說

深度學習,先跟上再說

文 | 孟岩

H是我認識的一個互聯網老炮,十多年前 Web 2.0 剛剛興起的時候,他做了幾個創業項目,基本上都是 Copy 2 China 類型的,雖然沒有像美團的王興一樣取得特別大的成功,但其中終於有一個在光景尚好的時候脫手賣掉,也算早早的實現了財務自由。中間有好幾年我跟他沒有什麼聯繫,斷斷續續的消息說,H 開始做一些投資,而且收益不錯。

前幾天在一個意想不到的場合突然見到 H,聊起彼此最近的興趣點,他竟然獅子大開口,滔滔不絕的講起深度學習來了。而且交流之中,我發現他對於深度學習的理解程度還真不只是停留在高瞻遠矚的互聯網口炮層次上,而是針對一些具體技術問題下過功夫鑽研。當然,他本人就是國內 Top 5 名校計算機科班出身的高材生,真下功夫研究這些東西是沒有問題的,但令我奇怪的是,你一個濃眉大眼搞投資的,不缺錢也不缺機會,你苦哈哈的去給神經網路調超參,你圖什麼呢?要是說你天性愛技術,逮什麼學什麼,那當年 Node.js、VR/AR和區塊鏈火的時候也沒見你往裡沖啊,為什麼對深度學習就這麼上心呢?

我把這個問題拋給他,他想了想,說了一段挺實在的話:

「其實是因為不得已。為什麼?因為深度學習結合力太強。它可以放在各個場景下,給各個領域帶來衝擊。我們不知道這個東西能用在多少地方,有多大的潛力,能搞出什麼名堂。別的技術,你大概可以設想出它極大發展之後所能達到的那個狀態。比如說,區塊鏈徹底重構互聯網,一切數字產品皆可資產,代碼即法律,所有的交易都自動履約完成;比如說,物聯網給每一粒灰塵賦予一個IP,納米機器人在我們的血液里縱橫,消滅一切疾病;比如說,VR創造出的虛擬世界讓人難辨真偽,一輩子體驗幾十輩子的人生,等等,這些事情,不管多麼科幻,你都可以想得到,它有一個明確的方向。有方向就好辦,你可以選擇說這個方向我要跟,或者這個方向我不跟。但是深度學習不一樣,你不知道它能力的邊界在哪裡,更沒有明確的場景限制。幾乎在你可以想到的任何事情中,你都可以構造一個複雜的網路,然後就把數據灌進去開始學啊學啊,蠻不講理的就可能得出一個更好的結果。在競爭當中,這種武器是最可怕的,沒有固定的形態,放到哪裡都有可能弄出一個意外的大殺器。這種武器,如果別人有而你沒有,不知道對方在什麼地方、什麼時候就突然拿出一個核彈把你炸得渣都不剩,你的準備、經驗和積累完全不起作用,而且在此之前你完全預見不了。這種感覺太可怕了,因此我必須直接掌握這個工具,這個不是技術情懷,也不是前瞻,而是不得已。」

不得不說這是一個很有說服力的觀點。

之前我也了解了一點深度學習,用 TensorFlow 搭了幾個模型,也看了一些論文。有兩個突出的感受。第一,深度學習這座山,你不爬到一定高度,其實做不出什麼新東西來,這跟之前的移動互聯網是兩碼事。跟著網上的教程把例子做出來並不難,但是解決新的問題,並不是誰都能做到的,不客氣的說,絕大多數人做不到。即便現在深度學習已經這麼火了,能夠把這個方法用在新的領域,創造新的網路結構,解決新的問題,這樣的研究者也是鳳毛麟角,屈指可數。第二,很多事情深度學習幹不了。Bharath Ramsundar最近寫了一篇文章,介紹了深度學習幹不了的那些事,洋洋洒洒列了十多條。其實之前某些媒體把深度學習描繪成為強人工智慧的最終解決方案,就是很不負責的。真正在這個領域的人都知道,這一波深度學習的技術並不能支持強人工智慧,現在很多普通圍觀群眾對 AI 的憧憬,多半將再一次落空。

所以,不容易學成,學成之後也有好多事情還幹不了,那麼究竟值不值得跟進深度學習?這其實一直是我內心的一個問題。

H 的一席話點醒了我。深度學習其實是一個我們這五年不得不去跟進的方向,因為它的結合性強,它的應用形態不可預測,它是一個「腦洞」科技。確實,它有很多事情幹不了,但反過來,它能幹成哪些事,也不是你能預見的。因為深度學習真正的威力不在於技術,而在於使用這個技術的人。你不知道你的對手會在哪個行業出現,從哪個地方開一個腦洞,對你現在所做的事情、對於你的經驗、優勢和自信心進行降維打擊。

我並不是在聳人聽聞。關於深度學習在計算機視覺、語音、自動翻譯、自動駕駛等領域的進展,相關報道最近幾年來已經汗牛充棟,我們已經逐漸消化了這些消息所帶來的衝擊,不再覺得驚奇。但是如果你以為深度學習只有這些本事,自己只要避開這些領域就可以不受衝擊,你可能就太樂觀了。

2012年9月,Kaggle 舉辦了Merck分子活動數據挖掘大賽https://www.kaggle.com/c/MerckActivity。各路分子生物學、醫學、化學和藥學數據科學團隊紛紛出場,激烈廝殺。這個時候,Geoffrey Hinton 的博士生團隊拎著深度學習大殺器闖進賽場,僅僅用了兩個星期,就把各路高手紛紛干翻,奪得冠軍。重要的是,這個冠軍團隊是清一色的計算機和深度學習專家,一點生物、醫學、分子、化學背景都沒有。難道資深專業人士在深度學習面前如此不堪一擊嗎?這件事情當時震撼了科技界,連《紐約時報》都進行了報道http://www.nytimes.com/2012/11/24/science/scientists-see-advances-in-deep-learning-a-part-of-artificial-intelligence.html。不過今天看來,這件事只是一幕序曲。未來相當長的一段時間裡,很多行業都可能會出現一批用深度學習武裝到牙齒的野蠻人,以你意想不到的方式,從你意想不到的角度對你進行暴擊。

你還記得2006年 Netflix 推出的百萬美金大獎賽嗎http://www.netflixprize.com/?當時 Netflix 懸賞100萬美金給第一個能夠將其影碟推薦演算法性能提高10個百分點的團隊。時隔三年之後,經過不斷的努力,終於有團隊拿到獎金。冠軍團隊的演算法以集成演算法為基礎,整合了107種不同的優化技術,最後提高了10.06%。而2016年,有人用 Keras 寫了一段不到20行的深度神經網路程序https://karthkk.wordpress.com/2016/03/22/deep-learning-solution-for-netflix-prize/,經過40個 epoch 迭代,效果非常接近當年的冠軍。這就是深度學習的威力。

京東在618這一天啟用了配送機器人,一天之內在人大校園內配送了20單。這個機器人能夠自動避讓行人,應該有深度學習的支持。這個機器人的出現,當然是京東的創新,但另一方面,這也是對京東引以為傲的配送鐵軍的威脅。智慧物流發展到高度自動化的階段,一輛大型物流車一路開一路沿途放下配送機器人,用戶通過手機開鎖取貨,今天必須由快遞員完成的大部分配送工作,未來靠機器人就可以完成。物流業將變成什麼樣?電商將變成什麼樣?

金融量化交易領域,傳統的演算法交易系統研究已經多年,有研究先行指標的,也有用傳統機器學習演算法調了很久的模型,也出現了像 MetaTrader 這樣的自動交易機器人開發平台。大家正在不斷積累蓋樓,其樂融融。現在突然出現一組人,用深度學習和深度增強學習殺到這個領域裡。他們悄悄的進村,打槍的不要,但是出手不凡,在選股策略和價格預測等方面已經取得很大的成功。現在來看,很有可能深度學習在很短的時間裡能把老炮們辛辛苦苦積累了多年的大部分指標和模型拋到垃圾堆里。有興趣了解的可以參考這個文檔https://qplumproduction.s3.amazonaws.com/uploads/file_download/pdf_file/17/deep-learning-in-trading.pdf。

當然,從市場數據里踏踏實實建模,這還只是常規思路。深度學習的牛逼之處在於它鼓勵腦洞。比如,有些人設想用深度學習捕捉企業高管演講內容和面部表情,來判斷股票價格走勢。這個腦洞開得夠大嗎?恐怕還只是一個開始。

搜索和計算廣告學(當前機器學習最大落地應用沒有之一)領域,深度學習也已經開始悄悄上線。前不久阿里P10專家蓋昆發表了一篇論文https://arxiv.org/pdf/1704.05194.pdf,公布了2012年以來阿里所使用的廣告點擊率預測演算法 LS-PLM。論文中介紹 LS-PLM 平均來說比邏輯回歸演算法的 AUC 高 1.44 個百分點。這對於每天數億 PV 的阿里系網站來說,當然有非常巨大的價值。這麼牛的演算法,時隔五年被公布出來,外界猜測,阿里內部一定部署了新的廣告點擊率預測演算法,而且一定比 LS-PLM 有明顯的優勢。會是什麼樣的演算法呢?非常大的可能是基於深度學習的演算法。這篇文章也許能給我們一點提示https://arxiv.org/pdf/1609.06018.pdf。

搜索和計算廣告學算是大數字營銷當中的一部分,大多數情況下它解決的是消費者已經表露出來的消費需求,這就已經支撐起了整個互聯網產業幾乎一半的收入。實際上數字營銷里還有更大的一塊,就是針對客戶的潛在需求進行個性化推廣,以及品牌傳播。把系統對於用戶的了解跟商家的營銷需要結合到一起,再用上深度學習,會發生什麼?Lars Eidneshttps://larseidnes.com/開發了一個「標題黨」RNN,可以自動生成聳人聽聞的標題或者誘餌鏈,他基於這個 RNN 開發了一個網站叫 Clickotronhttp://clickotron.com/,可能是世界上第一個完全用RNN生成標題和新聞內容的網站。我們可以設想以後的互聯網新聞和商家宣傳文字都是根據你的個人偏好實時生成的。同一條新聞,你看到的版本跟我看到的版本不同,目的卻是為了吸引我們採取某種特定的行動,比如買買買。這樣的技術如果成熟,今天數萬億美元的企業營銷、品牌和廣告行業將面目全非。想到這些,我不知道都有多少人會嚇出一身病來。

你有病,深度學習有葯。在醫療領域,有些實力雄厚的大公司在診療專家系統方面有多年的投資和積累,聘請了一大批醫學專家,建立了先進的基於規則的診療系統。但是突然之間,一幫野蠻人衝進賽場,用深度學習暴力蠻算,在醫學影像分析、藥學等領域已經帶來很大衝擊。賓夕法尼亞大學醫學院教授 Nick Bryan 認為,十年內所有醫學影像都將首先交給機器讀片,有質疑才會由人類複審。如果你知道現在醫學影像在醫療診斷的作用,你就會知道這個變化對於醫生這個行業的影響有多大。但這只是剛剛開始,醫療診斷本身就是機器學習的最佳應用領域之一,

還有,CMU有兩位教授在研究用深度學習自動編程,印度尼西亞一所大學用深度學習來研究高層建築結構在地震中的力學特徵,MIT的研究員在用深度學習給默片自動配音,Kaggle上有一個團隊開發的英語作文自動評分系統,表現比人類教師更一致。還有人在研究如何根據你的照片來判斷照片拍攝的位置,還有一個應用根據你在 IM 工具中的對話內容自動建議表情包,幫助你進行表情包大作戰…

這樣的例子我可以不斷舉下去,但要點不是這些新的進展有多炫酷,而是深度學習這項技術的可結合性,確實是超強的。它就像氧氣,碰到什麼就把什麼氧化,你不知道它會從那裡鑽進來驅動創新。而每一個這樣的創新,背後都是一個行業被改變,一堆人的工作和生活方式被衝擊。正如 H 所說,跟進深度學習,不是我們要表現的多麼新潮或者前瞻,而是不得已。所以,雖然深度學習挺難學,而且很有可能學下來也無所施展,但是我認識的一大批技術老炮都在跟進,捧起多年未翻的數學書開始吭哧吭哧學習,為什麼?就是因為面對新的時代,手裡沒有深度學習這個大殺器,說話就不硬氣。

我建議有條件的人,不必再猶豫了,儘快跟進深度學習吧,不必陷入孰優孰劣的爭論之中,也不一定非要等到有了現成的加薪跳槽機會。坦率的說,深度學習人才的薪資今天是存在一定的泡沫的,但是以後這個泡沫會吹得更大。進入深度學習能給你打開一扇窗,幫助你在各個領域開拓創新的可能性。更重要的是,使你在很多領域裡獲得話語權,獲得上牌桌的機會。

最後我做一個廣告。對於那些決心進入深度學習的人來說,我推薦CSDN和 AI100 馬上將要推出的《深度學習基礎與TensoFlow實踐》課程http://edu.csdn.net/huiyiCourse/detail/422。雖然這個課程還在準備當中,但從我目前了解到的情況來看,我有信心這將是目前市面上有水平、有特色的一個深度學習培訓課程。

我的信心來自兩點。

第一點是教學思路。對於一般人來說,入門深度學習最大的風險是把握不好節奏,不知哪裡當詳哪裡可略,在一些理論細節上糾纏太久,消耗精力和信心,最後中途而廢。而這個課程的主講人是海豚瀏覽器的深度學習專家王琛。我曾經就如何入門深度學習跟王琛以及海豚瀏覽器的 CEO 劉鐵鋒進行過數次探討,思路非常一致。王琛本人雖然是愛丁堡大學人工智慧專業科班出身的高手,但在海豚瀏覽器團隊中長期的產品和工程實踐使他非常接地氣。他堅信,在 TensorFlow 等工具的支持下,今天入門深度學習的人,不能長時間糾纏於數學和理論基礎,應該以工具為抓手,以實踐為導引,先把握主要理論和技巧,集中突擊,快速應用,先把深度學慣用起來,然後在問題的驅動下倒回去補足基礎。我認為這個思路對今天絕大多數深度學習愛好者來說是友好的、適用的。這次培訓課程的整個體系就是按照這個思路組織起來的,王琛的教學框架,是經過多次線下培訓打磨出來的。他計劃在五次講授中,帶領學員快速突破,迅速掌握深度學習的主要框架,達到可以動手實踐的程度,既大膽放棄對初學者來說不必要的枝節,又為後續的深造留下氣口。我相信會是目前網上比較實戰的一個教學體系。

另一點信心來自於王琛參與撰寫的一本書,名字與這次課程的題目一樣,《深度學習原理與 TensorFlow 實踐》http://dwz.cn/68qOOL。為什麼這本書很重要呢?首先是因為這本書寫得很不錯,詳略得當,暢快淋漓。但更重要的是因為因為深度學習還是有一定的理論要求的。你再提綱挈領,再實踐引導,對於一些關鍵的理論也還是得掌握。我目前正在跟著國外一個著名的在線課程學習深度學習,根據我的體驗,光看視頻、做練習,確實可以提高動手能力,但是理論上的理解,恐怕還是得啃書。如果沒有書,當一個理論問題沒搞懂的時候,我就得反覆去看視頻。但是視頻的優勢是生動,真的到嚴格的理論推導,很多時候其實效果並不是那麼好。因此,在學習一個課程的時候,有一本教材可作參考,作為課程內容的深度延展,這是十分重要的。王琛將要開的這門視頻課程,可能是目前市面上唯一一個擁有配套教材的深度學習在線課程。學生可以聽完可之後精讀這本書的相關內容。也就是說,因為這本教材的存在,這門課程的教學內容被成幾倍的放大了,學習者的成功幾率也就大得多了。

點擊展開全文

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 CSDN 的精彩文章:

父親節,技術人不應放棄對那些編程語言之父的愛
朋友,真正的程序員到底應該是什麼樣子的?
編譯和解釋的區別在哪?

TAG:CSDN |

您可能感興趣

什麼是深度學習?
深度學習很難?一文讀懂深度學習!
什麼叫深度學習?
相比於深度學習,機器學習沒落了嗎?
深度學習的過去,現在和未來
什麼是深度強化學習:人工智慧和深度學習的下一步
特徵工程也能達到深度學習的表現,是深度學習太弱還是任務太簡單?
解釋深度學習的新角度,來自光學的啟發
從零到一:帶你認識深度學習!
幾何深度學習前沿
深度學習的黑暗時代已來臨?
3分鐘,帶你深入了解機器學習和深度學習!
邂逅深度學習
還糾結選機器學習還是深度學習?看完你就有數了
這份圖靈深度學習的書單,再不看就晚了!
好好的深度學習系統,就被你用來上班摸魚?
快速入門深度學習,從這一步做起!
深度學習是藍海還是深坑?
深度講解:出馬那些事之先學會做人在領仙
深度學習到頂,AI寒冬將至!