當前位置:
首頁 > 知識 > 從「猿」到「金剛」,機器學習讓你在職業生涯超進化!

從「猿」到「金剛」,機器學習讓你在職業生涯超進化!

立即參團


原價

 ¥899.00



50人以上  ¥499.00


100人以上 

 ¥399.00




目前已達最低價


文末加客服二維碼參團




課程名稱


《機器學習升級版Ⅵ》 


主講老師


鄒博, 小象學院獨家簽約  中國科學院副教授


中國科學院

副教授

,北京某氣象公司首席科學家;研究方向機器學習、數據挖掘、計算幾何,應用於大型氣象設備的圖像與文本挖掘、股票交易與預測、傳統農資產品價格預測和決策等領域。


升級內容


本課程特點是

從數學層面推導最經典的機器學習演算法,以及每種演算法的示例和代碼實現(Python)、如何做演算法的參數調試、以實際應用案例分析各種演算法的選擇等。



學習收益



1.每個演算法模塊按照「

原理講解→分析數據→自己動手實現→特徵與調參

」的順序,「原理加實踐,頂天立地」。


2.

拒絕簡單的「調包」

——增加3次「機器學習的角度看數學」和3次「Python數據清洗和特徵提取」,提升學習深度、降低學習坡度。


3.增加網路爬蟲的原理和編寫,從獲取數據開始,重視將實踐問題轉換成實際模型的能力,分享工作中的

實際案例或Kaggle案例

廣告銷量分析、環境數據異常檢測和分析、數字圖像手寫體識別、Titanic乘客存活率預測、用戶-電影推薦、真實新聞組數據主題分析、中文分詞、股票數據特徵分析

等。


4.強化

矩陣運算、概率論、數理統計

的知識運用,掌握機器學習根本。


5.闡述機器學習原理,提供配套源碼和數據;確保

「懂推導,會實現」


6.刪去過於晦澀的公式推導,代之以

直觀解釋

,增強

感性理解


7.對比不同的特徵選擇帶來的預測效果差異。


8.重視

項目實踐

(如工業實踐、Kaggle等),重視落地。思考不同演算法之間的區別和聯繫,提高在實際工作中

選擇演算法的能力


9.涉及和講解的部分

Python庫

有:Numpy、Scipy、matplotlib、Pandas、scikit-learn、XGBoost、libSVM、LDA、Gensim、NLTK、HMMLearn,涉及的其他「小」庫在課程的實踐環節會逐一講解。



開課時間


2017年8月2日



學習方式


在線直播

,共24次


每周

3

次(周一、三、五晚20:00-22:00)


直播後提供錄製

回放

視頻


可在線

反覆

觀看,有效期

1



課程大綱




第一課:機器學習的數學基礎1 - 數學分析


 


1.  機器學習的一般方法和橫向比較


2.  數學是有用的:以SVD為例


3.  機器學習的角度看數學


4.  複習數學分析


5.  直觀解釋常數e


6.  導數/梯度


7.  隨機梯度下降


8.  Taylor展式的落地應用


9.  gini係數


10. 凸函數


11. Jensen不等式


12. 組合數與信息熵的關係


 


第二課:機器學習的數學基礎2 - 概率論與貝葉斯先驗


 


1.  概率論基礎


2.  古典概型


3.  貝葉斯公式


4.  先驗分布/後驗分布/共軛分布


5.  常見概率分布


6.  泊松分布和指數分布的物理意義


7.  協方差(矩陣)和相關係數


8.  獨立和不相關


9.  大數定律和中心極限定理的實踐意義


10.  深刻理解最大似然估計MLE和最大後驗估計MAP


11.  過擬合的數學原理與解決方案


 


第三課:機器學習的數學基礎3 - 矩陣和線性代數


 


1.  線性代數在數學科學中的地位


2.  馬爾科夫模型


3.  矩陣乘法的直觀表達


4.  狀態轉移矩陣


5.  矩陣和向量組


6.  特徵向量的思考和實踐計算


7.  QR分解


8.  對稱陣、正交陣、正定陣


9.  數據白化及其應用


10.  向量對向量求導


11.  標量對向量求導


12.  標量對矩陣求導


 


第四課:Python基礎1 - Python及其數學庫


 


1.  解釋器Python2.7與IDE:Anaconda/Pycharm


2.  Python基礎:列表/元組/字典/類/文件


3.  Taylor展式的代碼實現


4.  numpy/scipy/matplotlib/panda的介紹和典型使用


5.  多元高斯分布


6.  泊松分布、冪律分布


7.  典型圖像處理


8.  蝴蝶效應


9.  分形與可視化


 


第五課:Python基礎2 - 機器學習庫


 


1.  scikit-learn的介紹和典型使用


2.  損失函數的繪製


3.  多種數學曲線


4.  多項式擬合


5.  快速傅里葉變換FFT


6.  奇異值分解SVD


7.  Soble/Prewitt/Laplacian運算元與卷積網路


8.  卷積與(指數)移動平均線


9.  股票數據分析


 


第六課:Python基礎3 - 數據清洗和特徵選擇


 


1.  實際生產問題中演算法和特徵的關係


2.  股票數據的特徵提取和應用


3.  一致性檢驗


4.  缺失數據的處理


5.  環境數據異常檢測和分析


6.  模糊數據查詢和數據校正方法、演算法、應用


7.  樸素貝葉斯用於鳶尾花數據


8.  GaussianNB/MultinomialNB/BernoulliNB


9.  樸素貝葉斯用於18000+篇/Sogou新聞文本的分類


 


第七課: 回歸


 


1.  線性回歸


2.  Logistic/Softmax回歸


3.  廣義線性回歸


4.  L1/L2正則化


5.  Ridge與LASSO


6.  Elastic Net


7.  梯度下降演算法:BGD與SGD


8.  特徵選擇與過擬合


 


第八課:Logistic回歸


 


1.  Sigmoid函數的直觀解釋


2.  Softmax回歸的概念源頭


3.  Logistic/Softmax回歸


4.  最大熵模型


5.  K-L散度


6.  損失函數


7.  Softmax回歸的實現與調參


 


第九課:回歸實踐


 


1.  機器學習sklearn庫介紹


2.  線性回歸代碼實現和調參


3.  Softmax回歸代碼實現和調參


4.  Ridge回歸/LASSO/Elastic Net


5.  Logistic/Softmax回歸


6.  廣告投入與銷售額回歸分析


7.  鳶尾花數據集的分類


8.  交叉驗證


9.  數據可視化


 


第十課:決策樹和隨機森林


 


1.  熵、聯合熵、條件熵、KL散度、互信息


2.  最大似然估計與最大熵模型


3.  ID3、C4.5、CART詳解


4.  決策樹的正則化


5.  預剪枝和後剪枝


6.  Bagging


7.  隨機森林


8.  不平衡數據集的處理


9.  利用隨機森林做特徵選擇


10. 使用隨機森林計算樣本相似度


11. 數據異常值檢測


 


第十一課:隨機森林實踐


 


1.  隨機森林與特徵選擇


2.  決策樹應用於回歸


3.  多標記的決策樹回歸


4.  決策樹和隨機森林的可視化


5.  葡萄酒數據集的決策樹/隨機森林分類


6.  波士頓房價預測


 


第十二課:提升


 


1.  提升為什麼有效


2.  梯度提升決策樹GBDT


3.  XGBoost演算法詳解


4.  Adaboost演算法


5.  加法模型與指數損失


 


第十三課:提升實踐


 


1.  Adaboost用於蘑菇數據分類


2. Adaboost與隨機森林的比較


3.  XGBoost庫介紹


4.  Taylor展式與學習演算法


5.  KAGGLE簡介


6.  泰坦尼克乘客存活率估計


 


第十四課:SVM


 


1.  線性可分支持向量機


2.  軟間隔的改進


3.  損失函數的理解


4.  核函數的原理和選擇


5.  SMO演算法


6.  支持向量回歸SVR


 


第十五課:SVM實踐


 


1.  libSVM代碼庫介紹


2.  原始數據和特徵提取


3.  葡萄酒數據分類


4.  數字圖像的手寫體識別


5.  SVR用於時間序列曲線預測


6.  SVM、Logistic回歸、隨機森林三者的橫向比較


 


第十六課:聚類(上)


 


1.  各種相似度度量及其相互關係


2.  Jaccard相似度和準確率、召回率


3.  Pearson相關係數與餘弦相似度


4.  K-means與K-Medoids及變種


5.  AP演算法(Sci07)/LPA演算法及其應用


 


第十七課:聚類(下)


 


1.  密度聚類DBSCAN/DensityPeak(Sci14)


2.  DensityPeak(Sci14)


3.  譜聚類SC


4.  聚類評價AMI/ARI/Silhouette


5.  LPA演算法及其應用


 


第十八課:聚類實踐


 


1.  K-Means++演算法原理和實現


2.  向量量化VQ及圖像近似


3.  並查集的實踐應用


4.  密度聚類的代碼實現


5.  譜聚類用於圖片分割


 


第十九課:EM演算法


 


1.  最大似然估計


2.  Jensen不等式


3.  樸素理解EM演算法


4.  精確推導EM演算法


5.  EM演算法的深入理解


6.  混合高斯分布


7.  主題模型pLSA


 


第二十課:EM演算法實踐


 


1.  多元高斯分布的EM實現


2.  分類結果的數據可視化


3.  EM與聚類的比較


4.  Dirichlet過程EM


5.  三維及等高線等圖件的繪製


6.  主題模型pLSA與EM演算法


 


 

第二十一課:主題模型LDA


 


1.  貝葉斯學派的模型認識


2.  Beta分布與二項分布


3.  共軛先驗分布


4.  Dirichlet分布


5.  Laplace平滑


6.  Gibbs採樣詳解


 


第二十二課:LDA實踐


 


1.  網路爬蟲的原理和代碼實現


2.  停止詞和高頻詞


3.  動手自己實現LDA


4.  LDA開源包的使用和過程分析


5.  Metropolis-Hastings演算法


6.  MCMC


7.  LDA與word2vec的比較


8.  TextRank演算法與實踐


 


第二十三課:隱馬爾科夫模型HMM


 


1.  概率計算問題


2.  前向/後向演算法


3.  HMM的參數學習


4.  Baum-Welch演算法詳解


5.  Viterbi演算法詳解


6.  隱馬爾科夫模型的應用優劣比較


 


第二十四課:HMM實踐


 


1.  動手自己實現HMM用於中文分詞


2.  多個語言分詞開源包的使用和過程分析


3.  文件數據格式UFT-8、Unicode


4.  停止詞和標點符號對分詞的影響


5.  前向後向演算法計算概率溢出的解決方案


6.  發現新詞和分詞效果分析


7.  高斯混合模型HMM


8.  GMM-HMM用於股票數據特徵提取


常見問題






Q: 參加本門課程有什麼要求?


A: 有基本的大學

數學

基礎, 掌握

Python

語言編程。


Q:會有實際上機演示和動手操作嗎?


A:有的,老師會在相關課時準備上機演示部分,學員可以學習老師的實踐經驗






長按掃碼加客服報名,諮詢↓




喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 Python開發者 的精彩文章:

基於協程的 Python 網路庫 gevent 介紹
用 Python 進行貝葉斯模型建模(3)
IEEE Spectrum 2017 編程語言排行:Python 奪冠
Python 求職 Top10 城市,來看看是否有你所在的城市
機器學習演算法實踐:樸素貝葉斯 (Naive Bayes)

TAG:Python開發者 |

您可能感興趣

如何從學習生涯順利過渡到職業生涯?
「他的職業是生活。」
猛獁象的屍體誰敢挖?挖到就是賺到,這職業牛!
不搞青訓,退回非職業化,進回世界盃又怎樣?又不是沒進過!
從追星迷妹到職業攝影師,她成了音樂現場的「搖滾女戰士」
在職場遇到這個人,你的職業生涯的噩夢就開始了!
老外來到中國的職業技術學校,挑戰挖掘機專業學生,結果被吊打
金乃嘉:從教師到職業規劃師,發現自己更多可能性
戰機飛行員那麼危險的職業,他們的工資水平怎樣?說出來怕嚇到你
姿態未獲去MSI的機會,看到他職業生涯的變化,引髮網友感慨!
職業危機不分年齡,系統化的終身學習才是你的出路
軟體開發到旅遊產品經理,八竿子打不著的職業是怎樣轉型成功的?
產品設計學生如何快速地進化到職業設計師?
機器心理學家:可能是未來唯一不會被AI取代的職業
化妝師現在是一個好的職業選擇嗎?
我是如何選擇大學專業和未來職業的?|湯米
將來會被機器人取代的職業有哪些?機器人已經淘汰了很多職業
從「職場小白」到職業白領,我都經歷了什麼
職業生涯結束後,飛機都去哪了?
只用了4年練出職業健美運動員的水平!他是怎麼做到的?