周志華推薦 | 李沐《動手學深度學習》中文版上線
【新智元導讀】李沐大神《動手學深度學習》中文版發布了!與當前其它深度學習教科書相比,本教科書更加註重互動式的學習體驗。新智元值此之際,與人民郵電出版社合作開展免費贈書活動!
深度學習在短短几年之內便讓世界大吃一驚。
它非常有力地推動了計算機視覺、自然語言處理、自動語音識別、強化學習和統計建模等多個領域的快速發展。
隨著這些領域的不斷進步,人們現在可以製造自動駕駛的汽車,基於簡訊、郵件甚至電話的自動回復系統,以及在圍棋中擊敗最優秀人類選手的軟體。這些由深度學習帶來的新工具也正產生著廣泛的影響。
與此同時,深度學習也給它的使用者們帶來了獨一無二的挑戰:任何單一的應用都彙集了各學科的知識。
具體來說,應用深度學習需要同時理解:
- 問題的動機和特點;
- 將大量不同類型神經網路層通過特定方式組合在一起的模型背後的數學原理;
- 在原始數據上擬合極複雜的深層模型的優化演算法;
- 有效訓練模型、避免數值計算陷阱以及充分利用硬體性能所需的工程技能;
- 為解決方案挑選合適的變數(超參數)組合的經驗。
這就為讀者學習深度學習(尤其是在選擇學習書目的過程中)帶來了一定的挑戰。
近期,由MXNet創始人李沐大神、Aston Zhang等人所著的互動式深度學習書籍《動手學深度學習》出版了!
相信很多人早在去年年底便已拜讀過這本書的在線預覽版。而此次出版、線上出售的是中文版教科書!
為什麼要選擇《動手學深度學習》?
目前市面上有關深度學習介紹的書籍大多可分兩類,一類側重方法介紹,另一類側重實踐和深度學習工具的介紹。
本書同時覆蓋方法和實踐
本書不僅從數學的角度闡述深度學習的技術與應用,還包含可運行的代碼,為讀者展示如何在實際中解決問題。
為了給讀者提供一種互動式的學習體驗,《動手學深度學習》不但提供免費的教學視頻和討論區,而且提供可運行的Jupyter記事本文件,充分利用Jupyter記事本能將文字、代碼、公式和圖像統一起來的優勢。
這樣不僅直接將數學公式對應成實際代碼,而且可以修改代碼、觀察結果並及時獲取經驗,從而帶給讀者全新的、互動式的深度學習的學習體驗。
適合哪些人群閱讀?
本書面向希望了解深度學習,特別是對實際使用深度學習感興趣的大學生、工程師和研究人員。
本書不要求讀者有任何深度學習或者機器學習的背景知識,讀者只需具備基本的數學和編程知識,如基礎的線性代數、微分、概率及Python編程知識。
本書的附錄中提供了書中涉及的主要數學知識,供讀者參考。
與其它深度學習教科書相比,有何獨具匠心的特點?
目前,一些有關深度學習的教科書不斷問世,那麼《動手學深度學習》與這些教科書有何區別呢?
與Goodfellow《深度學習》相比
在近期不斷問世的深度學習教科書中,最為著名的要數Goodfellow、Bengio和Courville的《深度學習》。該書梳理了深度學習背後的眾多概念與方法,是一本極為優秀的教材。
然而,這類資源並沒有將概念描述與實際代碼相結合,以至於有時會令讀者對如何實現它們感到毫無頭緒。
與吳恩達的深度學習課程相比
在知乎中,李沐老師表達了與吳恩達的深度學習課程相比的區別:
- 我們不僅介紹深度學習模型,而且提供簡單易懂的代碼實現。我們不是通過幻燈片來講解,而是通過解讀代碼,實際動手調參數和跑實驗來學習。
- 我們使用中文。不管是教材、直播,還是論壇。(雖然在美國呆了5至6年,事實上我仍然對一邊聽懂各式口音的英文一邊理解內容很費解)。
- Andrew的課程目前免費版本只能看視頻,而我們不僅僅直播教學,而且提供練習題,提供大家交流的論壇,並鼓勵大家在GitHub上參與到課程的改進。希望能與大家更近距離的進行交流。
除了這些以外,商業課程提供者們雖然製作了眾多的優質資源,但它們的付費門檻依然令不少用戶望而生畏。
包含代碼、數學、網頁、討論的統一資源
我們在2017年7月啟動了寫作這本書的項目。當時我們需要向用戶解釋Apache MXNet在那時的新介面Gluon。不幸的是,我們並沒有找到任何一個資源可以同時滿足以下幾點需求:
- 包含較新的方法和應用,並不斷更新;
- 廣泛覆蓋現代深度學習技術並具有一定的技術深度;
- 既是嚴謹的教科書,又是包含可運行代碼的生動的教程。
那時,我們在博客和GitHub上找到了大量的演示特定深度學習框架(例如用TensorFlow進行數值計算)或實現特定模型(例如AlexNet、ResNet等)的示例代碼。這些示例代碼的一大價值在於提供了教科書或論文往往省略的實現細節,比如數據的處理和運算的高效率實現。如果不了解這些,即使能將演算法倒背如流,也難以將演算法應用到自己的項目中去。此外,這些示例代碼還使得用戶能通過觀察修改代碼所導致的結果變化而快速驗證想法、積累經驗。因此,我們堅信動手實踐對於學習深度學習的重要性。然而可惜的是,這些示例代碼通常側重於如何實現給定的方法,卻忽略了有關演算法設計的探究或者實現細節的解釋。雖然在像Distill這樣的網站和某些博客上出現了一些有關演算法設計和實現細節的討論,但它們常常缺少示例代碼,並通常僅覆蓋深度學習的一小部分。
另外,我們欣喜地看到了一些有關深度學習的教科書不斷問世,其中最著名的要數Goodfellow、Bengio和Courville的《深度學習》。該書梳理了深度學習背後的眾多概念與方法,是一本極為優秀的教材。然而,這類資源並沒有將概念描述與實際代碼相結合,以至於有時會令讀者對如何實現它們感到毫無頭緒。除了這些以外,商業課程提供者們雖然製作了眾多的優質資源,但它們的付費門檻依然令不少用戶望而生畏。
正因為這樣,深度學慣用戶,尤其是初學者,往往不得不參考來源不同的多種資料。例如,通過教科書或者論文來掌握演算法及其相關數學知識,閱讀線上文檔學習深度學習框架的使用方法,然後尋找感興趣的演算法在這個框架上的實現並摸索如何將它應用到自己的項目中去。如果你正親身經歷這一過程,你可能會感到痛苦:不同來源的資料有時難以相互一一對應,即便能夠對應也可能需要花費大量的精力。例如,我們需要將某篇論文公式中的數學變數與某段網上實現中的程序變數一一對應,並在代碼中找到論文可能沒交代清楚的實現細節,甚至要為運行不同的代碼安裝不同的運行環境。
針對以上存在的痛點,我們正在著手創建一個為實現以下目標的統一資源:
- 所有人均可在網上免費獲取;
- 提供足夠的技術深度,從而幫助讀者實際成為深度學習應用科學家:既理解數學原理,又能夠實現並不斷改進方法;
- 包含可運行的代碼,為讀者展示如何在實際中解決問題。這樣不僅直接將數學公式對應成實際代碼,而且可以修改代碼、觀察結果並及時獲取經驗;
- 允許我們和整個社區不斷快速迭代內容,從而緊跟仍在高速發展的深度學習領域;
由包含有關技術細節問答的論壇作為補充,使大家可以相互答疑並交換經驗。
這些目標往往互有衝突:公式、定理和引用最容易通過LaTeX進行管理和展示,代碼自然應該用簡單易懂的Python描述,而網頁本身應該是一堆HTML及配套的CSS和JavaScript。此外,我們希望這個資源可以作為可執行代碼、實體書以及網站。然而,目前並沒有任何工具可以完美地滿足以上所有需求。
因此,我們不得不自己來集成這樣的一個工作流。我們決定在GitHub上分享源代碼並允許提交編輯,通過Jupyter記事本來整合代碼、公式、文本、圖片等,使用Sphinx作為渲染引擎來生成不同格式的輸出,並使用Discourse作為論壇。雖然我們的系統尚未完善,但這些選擇在互有衝突的目標之間取得了較好的折中。這很可能是使用這種集成工作流發布的第一本書。
名家推薦
來自學術界
這是一本及時且引人入勝的書。它不僅提供了深度學習原理的全面概述,還提供了具有編程代碼的詳細演算法,此外,還提供了計算機視覺和自然語言處理中有關深度學習的最新介紹。如果你想鑽研深度學習,請研讀這本書!
——韓家煒,ACM 院士、IEEE 院士、美國伊利諾伊大學香檳分校計算機系Abel Bliss教授
這是對機器學習文獻的一個很受歡迎的補充,重點是通過集成Jupyter 記事本實現的動手經驗。深度學習的學生應該能體會到,這對於熟練掌握這一領域是非常寶貴的。
——Bernhard Sch?lkopf,ACM 院士、德國國家科學院院士、德國馬克斯? 普朗克研究所智能系統院院長
這本書基於MXNet 框架來介紹深度學習技術,書中代碼可謂「所學即所用」,為喜歡通過Python 代碼進行學習的讀者了解、接觸深度學習技術提供了很大的便利。
——周志華,ACM 院士、IEEE 院士、AAAS 院士、南京大學計算機科學與技術系主任
這是一本基於Apache MXNet 的深度學習實戰書籍,可以幫助讀者快速上手並掌握使用深度學習工具的基本技能。本書的幾個作者都在機器學習領域有著非常豐富的經驗。他們不光有大量的工業界實踐經驗,也有非常高的學術成就,所以對機器學習領域的前沿演算法理解深刻。這使得作者們在提供優質代碼的同時,也可以把最前沿的演算法和概念深入淺出地介紹給讀者。這本書可以幫助深度學習實踐者快速提升自己的能力。
——張潼,香港科技大學計算機科學與數學教授
來自工業界
雖然業界已經有不錯的深度學習方面的書籍,但都不夠緊密結合工業界的應用實踐。 我認為《動手學深度學習》是最適合工業界研發工程師學習的,因為這本書把演算法理論、應用場景、代碼實例都完美地聯繫在一起,引導讀者把理論學習和應用實踐緊密結合,知行合一,在動手中學習,在體會和領會中不斷深化對深度學習的理解。 因此我毫無保留地向廣大的讀者強烈推薦《動手學深度學習》。
——余凱,地平線公司創始人、首席執行官
強烈推薦這本書!它其實遠不只是一本書:它不僅講解深度學習背後的數學原理,更是一個編程工作台與記事本,讓讀者可以一邊動手學習一邊收到反饋,它還是個開源社區平台,讓大家可以交流。作為在AI 學術界和工業界都長期工作過的人,我特別讚賞這種手腦一體的學習方式,既能增強實踐能力,又可以在解決問題中鍛煉獨立思考和批判性思維。
作者們是演算法工程兼強的業界翹楚,他們能奉獻出這樣的一本好的開源書,為他們點贊!
——漆遠,螞蟻金服副總裁、首席人工智慧科學家
作者簡介
阿斯頓·張(Aston Zhang):亞馬遜應用科學家,美國伊利諾伊大學香檳分校計算機科學博士,統計學和計算機科學雙碩士。他專註於機器學習的研究,並在數個頂級學術會議發表過論文。他擔任過NeurIPS、ICML、KDD、WWW、WSDM、SIGIR、AAAI 等學術會議的程序委員或審稿人以及Frontiers in Big Data 期刊的編委。
李沐(Mu Li):亞馬遜首席科學家(Principal Scientist),加州大學伯克利分校客座助理教授,美國卡內基梅隆大學計算機系博士。他專註於分散式系統和機器學習演算法的研究。他是深度學習框架MXNet 的作者之一。他曾任機器學習創業公司Marianas Labs 的CTO 和百度深度學習研究院的主任研發架構師。他在理論、機器學習、應用和操作系統等多個領域的頂級學術會議(包括FOCS、ICML、NeurIPS、AISTATS、CVPR、KDD 、WSDM、OSDI)上發表過論文。
亞歷山大 J. 斯莫拉(Alexander J. Smola)[德]:亞馬遜副總裁/ 傑出科學家,德國柏林工業大學計算機科學博士。他曾在澳大利亞國立大學、美國加州大學伯克利分校和卡內基梅隆大學任教。他發表了超過200 篇學術論文,並著有5 本書,其論文及書被引用超過10 萬次。他的研究興趣包括深度學習、貝葉斯非參數、核方法、統計建模和可擴展演算法。
扎卡里 C. 立頓(Zachary C. Lipton)[美] :亞馬遜副總裁/ 傑出科學家,德國柏林工業大學計算機科學博士。他曾在澳大利亞國立大學、美國加州大學伯克利分校和卡內基梅隆大學任教。他發表了超過200 篇學術論文,並著有5 本書,其論文及書被引用超過10 萬次。他的研究興趣包括深度學習、貝葉斯非參數、核方法、統計建模和可擴展演算法。
※《AutoML:方法,系統,挑戰》新書免費下載
※機器人教父:自動駕駛30年內能上路,實現通用人工智慧還要300年
TAG:新智元 |