當前位置:
首頁 > 科技 > 這套GitHub 1300星的NLP課程即將完結,視頻授課,在線答疑

這套GitHub 1300星的NLP課程即將完結,視頻授課,在線答疑

郭一璞 發自 椰子樹下

量子位 報道 | 公眾號 QbitAI

最近NLP方向的資源越來越多,GitHub上又出現了一套新的課程,目前已經獲得了1300多顆星星。

在這套NLP課程中,作者們把這套課程拆分成了13周,從文本嵌入分類開始講,到Seq2Seq,再到機器翻譯、對話系統,內容豐富。

每周的課程除了主要的講座視頻之外,還有研討會部分,聽眾可以在研討會上用英文提問,已經講完的課程帶有視頻和Python筆記,另外還有課後作業筆記。

13周的課程

具體的課程時間表如下:


第一周

講座:介紹文本嵌入、分散式語義、LSA、Word2Vec、GloVe的用法和使用場景。

研討會:單詞和句子嵌入。


第二周

講座:文本分類。

文本表示的經典方法:BOW,TF-IDF。

神經方法:嵌入,卷積,RNN。

研討會:卷積神經網路的薪酬預測; 解釋網路預測。


第三周

講座:語言模型,N-gram和神經方法; 可視化訓練的模型。

研討會:使用語言模型生成ArXiv論文。

第四周

講座:

Seq2seq:編碼器 - 解碼器框架。

Attention:Bahdanau模型。

研討會:酒店和宿舍描述的機器翻譯。


第五周

講座:結構化學習,結構化感知器,結構化預測,RL基礎知識。

研討會:POS標籤。


第六周

講座:期望最大化和單詞對齊模型。

研討會:實現期望最大化。


第七周

講座:機器翻譯,回顧PBMT的主要思想,過去3年NMT開發的應用程序特定思想以及該領域的一些開放性問題。

研討會:學生演講。

第八周

講座:網路學習的內容和原因:「模型」永遠不僅僅是「模型」!NLP中的多任務學習,如何理解,模型表示包含哪些信息。

研討會:通過與其他任務共同學習,提高指定實體的認可度


第9~13周

第9~13周的內容作者們還沒有更新,根據目錄來看,主要是講域名適應、對話系統、對抗方法和TBA。

作者

這份NLP教程一共有5位作者,其中一作小姐姐Elena Voita是俄羅斯AI公司Yandex的研究員,專供NLP、機器翻譯方向,今年還發了一篇關於文本識別和機器翻譯的ACL論文。

Elena Voita目前在阿姆斯特丹大學讀機器學習、NLP方向的博士,同時還是愛丁堡大學訪問博士。

傳送門

GitHub:

https://github.com/yandexdataschool/nlp_course

Jupyter:

https://mybinder.org/v2/gh/yandexdataschool/nlp_course/master

年度評選申請

加入社群

量子位AI社群開始招募啦,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話界面回復關鍵字「交流群」,獲取入群方式;

此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。

進專業群請在量子位公眾號(QbitAI)對話界面回復關鍵字「專業群」,獲取入群方式。(專業群審核較嚴,敬請諒解)

活動策劃招聘

量子位正在招聘活動策劃,將負責不同領域維度的線上線下相關活動策劃、執行。歡迎聰明靠譜的小夥伴加入,並希望你能有一些活動策劃或運營的相關經驗。相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 量子位 的精彩文章:

對話搜狗口語機器翻譯團隊:全球奪冠只為驗證技術,更看重落地商用
人工智慧還能怎麼玩?谷歌反手就是一個紅獅子雕塑

TAG:量子位 |