如何入門機器學習?這裡有一份來自英偉達計算機科學家的課程清單
雷鋒網 AI 科技評論按,在機器學習的入門和進階過程中,如果有一份好的 學習教程尤其是學習視頻,學習效果無疑會事半功倍。就職於英偉達人工智慧應用團隊的計算機科學家 Chip Huyen 根據自己多年的教學和工程經驗,總結了一份適合按順序依次學習的機器學習課程清單,具體清單如下文。
1、《Probability and Statistics(斯坦福概率和統計)》
課程地址:http://t.cn/RD2EjZI
課程簡介:
概率和統計課程包含四個主要單元,每個單元又細分為幾個部分。
探索性數據分析:這個單元分為兩個部分——分布檢查分布和關係檢查。一般方法是為參與者提供一個框架,幫助他們在各種情況下進行數據分析時選擇適當的描述性方法。
數據生產:該單元分為兩個部分——抽樣和設計研究。
概率:在本課程中,這部分的內容是概率的經典處理方法,包括基本概率原理、事件的發現概率、條件概率、離散隨機變數(包括二項式分布)和連續隨機變數(重點是正態分布)。本單元討論了以模擬為基礎的採樣分布。作為一個簡化的概率介紹,它沒有介紹傳統的概率處理,而傾向於使用相對頻率的經驗方法,參與者可以看到 OLI 統計推理課程。
推理:本單元介紹推理的邏輯以及主要形式相關的技術:點估計、區間估計和假設檢驗。該單元包括人口平均數和人口比例的推斷方法、兩組和兩組以上平均數比較的推斷方法(方差分析)、獨立性卡方檢驗和線性回歸。該單元加強了在探索性數據分析中引入的框架,以便在各種數據分析場景中選擇適當的推理方法。
在整個課程有許多互動。其中包括:模擬,「演練」,整合語音和圖形來解釋一個程序或一個困難概念。通過互動活動,學生練習如何解決問題,並且課程提供提示和即時、有針對性的反饋。學
2、《Linear Algebra(MIT 線性代數)》by Gilbert Strang
課程地址:http://t.cn/R61LGM4
課程簡介:
「線性代數」,同微積分一樣,是高等數學中兩大入門課程之一,不僅是一門非常好的數學課程,也是一門非常好的工具學科,在很多領域都有廣泛的用途。本課程講述了矩陣理論及線性代數的基本知識,側重於那些與其他學科相關的內容,包括方程組、向量空間、行列式、特徵值、相似矩陣及正定矩陣。
目前,該課程在網易公開課上也有中文版視頻和課件,網易公開課地址:http://open.163.com/special/opencourse/daishu.html
公開課共 35 個視頻,前面 9 個視頻如下:
目前該課程早已經更新完畢,同學們可以放心的學習啦~
3、《CS231N: Convolutional Neural Networks for Visual Recognition(斯坦福卷積網路視覺識別)》
課程地址:https://www.youtube.com/playlist?list=PLzUTmXVwsnXod6WNdg57Yc3zFx_f-RYsq
課程簡介:
CS231n 的全稱是 CS231n: Convolutional Neural Networks for Visual Recognition,即面向視覺識別的卷積神經網路。
該課程是斯坦福大學計算機視覺實驗室推出的課程。本次給出的都是 2017 春季(4 月至 6 月)的最新版本,課程由李飛飛教授和他的兩個博士生 Justin Johnson 和 Serena Yeung 領銜教授。
CS231n 課程資源主要由授課視頻與 PPT,客座講座,授課知識詳解筆記,課程作業,課程項目五部分組成。其中:
授課視頻 14 課。每節課時約 1 小時左右,每節課一份 PPT
客座講座 2 課。每節講座約 1 小時 30 分左右
授課知識詳解筆記共 16 份
課程作業 3 次
課程項目 1 個
拓展閱讀若干
如果你想了解計算機視覺,CS231n 是非常好的入門材料,也是計算機視覺和深度學習領域最經典的課程之一,這門課適合絕大多數想要學習深度學習知識的人。
4、《Practical Deep Learning for Coders(fastai 程序員深度學習實戰)》
課程地址:https://course.fast.ai/
愛可可老師在 kanbilibili 上上傳了視頻,也可以下載視頻學習:https://www.kanbilibili.com/video/av41718196/
課程簡介:
這是該課程的 2019 版本。該課程的老師是大名鼎鼎的 Jeremy Howard。Jeremy Howard 是大數據競賽平台 Kaggle 的前主席和首席科學家,也是 Kaggle 冠軍選手。他是美國奇點大學(Singularity University)最年輕的教職工,同時也是多家科技公司的創始人和 CEO。
Fast AI 是 Jeremy Howard 在 2017 年創立的,免費提供關於深度學習技術的系列實戰性視頻教程。該教程注重講解在工程實踐中真正行之有效的方法,這些方法都是 Jeremy Howard 本人親身經歷並總結出來的,是深度學習領域非常實用的教程。
5、《CS224N: Natural Language Processing with Deep Learning(斯坦福深度學習自然語言處理)》
課程地址:https://www.youtube.com/playlist?list=PLU40WL8Ol94IJzQtileLTqGZuXtGlLMP_
相關課件:https://ai.yanxishe.com/page/resourceDetail/770
課程簡介:
課程的領銜主講是自然語言處理領域著名學者,著有《統計自然語言處理基礎》、《信息檢索導論》等自然語言處理著名教材的 Christopher Manning 和 Salesforce 的首席科學家 Richard Socher。
自然語言處理(NLP)是信息時代最重要的技術之一。理解複雜的語言話語也是人工智慧的重要組成部分。NLP 的應用無處不在,NLP 應用程序背後有大量的基礎任務和機器學習模型,這些模型通常可以通過單一的端到端模型進行訓練,而不需要傳統的、特定任務特徵的工程。
在這個冬季課程中,學生將學習執行、訓練、調試、可視化和創造他們自己的神經網路模型。該課程全面介紹了應用於 NLP 的深度學習尖端研究。在模型方面,我們將介紹詞向量表示、基於窗口的神經網路、遞歸神經網路、長期短期記憶模型、遞歸神經網路、卷積神經網路以及一些涉及存儲器組件的最新模型。
通過講座和編程作業,學生將學會運用神經網路到實際問題中的必備技巧。
6、《Machine Learning(Coursera 斯坦福機器學習課程)》
課程地址:https://www.coursera.org/learn/machine-learning
課程簡介:
該課程的講師是大家都非常熟悉的 Andrew Ng。在本課程中,你將學習最有效的機器學習技術,你不僅會學到理論基礎,還將獲得快速地將這些技術應用於新問題所需的實踐知識。最後,你還會了解矽谷在創新方面和機器學習、人工智慧有關的一些最佳實踐。
本課程對機器學習、數據挖掘和統計模式識別進行了介紹。課程包括:
(i)監督學習(參數/非參數演算法、支持向量機、內核、神經網路);
(ii)無監督學習(聚類、降維、推薦系統、深度學習);
(iii)機器學習的最佳實踐(偏差/方差理論;機器學習的創新過程和人工智慧);
本課程還將通過大量的案例研究和應用程序,讓學生學習如何將學習演算法應用於構建智能機器人(感知、控制)、文本理解(網路搜索、反垃圾郵件)、計算機視覺、醫療信息學、音頻、數據挖掘和其他領域。
7、《Probabilistic Graphical Models Specialization(Coursera 斯坦福概率圖模型專項課程)》
課程地址:https://www.coursera.org/specializations/probabilistic-graphical-models
課程簡介:
該課程包含 3 個專項課程:
概率圖模型 1:表示
概率圖形模型(PGMS)是一個豐富的框架,用於編碼複雜域上的概率分布:在大量相互作用的隨機變數上的聯合(多變數)分布。本課程描述了兩種基本的 PGM 表示:基於有向圖的貝葉斯網路和使用無向圖的馬爾可夫網路。
本課程討論了這些表示的理論性質以及它們在實踐中的應用。除了基本的 PGM 表示,本課程還提供了一些重要的擴展,這些擴展允許更複雜的模型被緊湊地編碼。
概率圖模型 2:推理
在第一門側重於表示的課程之後,本課程將討論概率推理的問題:如何使用 PGM 來回答問題。
儘管 PGM 通常描述一個非常高維度的分布,但它的結構設計是為了有效地回答問題。本課程針對不同類型的推理任務提出了精確和近似的演算法,並討論了每種演算法的最佳應用場合。課程包含兩個實踐編程任務,實現了最常用的精確和近似演算法,並應用於實際問題。
概率圖模型 3:學習
本課程解決了學習問題:如何從一組示例數據中學習 PGM。課程討論了有向和無向模型中參數估計的關鍵問題,以及有向模型的結構學習任務。課程包含兩個實踐編程任務,實現了兩個常用學習演算法,並將其應用於實際問題。
8、《Introduction to Reinforcement Learning(DeepMind 強化學習導論)》
課程地址:https://www.youtube.com/playlist?list=PLqYmG7hTraZDM-OYHWgPebj2MfCFzFObQ
不能翻牆的同學可以在 bilibili 上學習這個課程:https://www.bilibili.com/video/av24060851/
課程簡介:
該課程是由 DeepMind 發布的,課程共有 10 個視頻,分別是:
強化學習入門
馬爾科夫決策過程
動態規劃
無模型預測
無模型控制
值函數逼近
策略梯度法
整合學習規劃
探索與利用
案例研究:經典遊戲中的強化學習
9、《Full Stack Deep Learning Bootcamp(全棧深度學習訓練營)》
課程地址:https://fullstackdeeplearning.com/march2019
課程簡介:
這是一個為熟悉深度學習基礎知識的開發人員提供實踐課程。在這個課程中,開發人員將完成項目:如何部署端到端的深度學習系統。
當然,開發人員還會學到有關生產實踐的深度學習知識,包括
闡述問題並估算項目成本
查找、清洗、標記和擴充數據
選擇正確的框架和計算基礎架構
故障排除訓練,確保可重現性
大規模模型部署
學生們將完成一個最終將計算機視覺和自然語言處理系統部署到生產中的項目。也有機會測試你的知識,並準備參加可選的筆試面試。
兩天的課程包含的具體內容如下圖所示:
在課程完成之後,還可以參加筆試和面試來測試自己的水平。
10、《How to Win a Data Science Competition: Learn from Top Kagglers(Coursera 跟頂級 Kagglers 學習如何贏取數據科學競賽)》
課程地址:https://www.coursera.org/learn/competitive-data-science/home/welcome
如果你想開始學習數據科學,那麼這門課程就是為你準備的!
參加建模預測競賽可以幫助你獲得實踐經驗,提高在信貸、保險、營銷、自然語言處理、銷售預測和計算機視覺等各個領域的數據建模技能。在本課程中,您將學習如何分析和完成具此類有難度的預測建模任務。
當你完成這門課,你將:
了解如何有效地完成預測性建模競賽,並將學會的技能用於實際任務
了解如何預處理數據並通過各種數據(如文本和圖像)生成新特徵
學習高級的特徵工程技術
能夠形成可靠的交叉驗證方法
獲得分析和解析數據的經驗
掌握不同演算法的知識,學習如何有效地調整超參數並獲得最佳性能
了解過去的冠軍方案和代碼,並學習如何閱讀它們
本課程將教你如何獲得高級別的解決方案,重點是機器學習方法的實際使用,而不是背後的理論基礎。因此,學習這門課的先決條件是你必須具備機器學習的基礎知識。
11.《BerkeleyX: CS188.1x Artificial Intelligence(伯克利 AI)》
課程地址:https://courses.edx.org/courses/BerkeleyX/CS188.1x-4/1T2015/course/
課程簡介:
該課程歷時 11 周,從最基本的 AI 概念講起,再過渡到搜索規劃、博弈論、強化學習等等內容。課程中間穿插了 3 個實踐項目,分別是搜索規劃、遊戲樹和決策理論和強化學習。在完成課程的學習之後,可以參加期末考試,考試通過的同學可以獲得證書。
學習該課程需要的知識儲備:
程序設計:面向對象編程、遞歸、Python 或快速學習 Python 的能力
數據結構:列表與集合(數組,哈希表)、隊列(堆棧,隊列,優先順序隊列)、樹與圖(遍歷,背景)
數學:概率,隨機變數和期望(離散)、基本漸近複雜度(Big-O)、基本計數(排列組合)
雷鋒網雷鋒網
※機器學習如何從上游抑制歧視性行為?斯坦福 AI 實驗室的最新成果給出了答案
※5GAI是打開完全靠譜自動駕駛的正確方式嗎?
TAG:雷鋒網 |