這套GitHub 1300星的NLP課程即將完結,視頻授課,在線答疑
郭一璞 發自 椰子樹下
量子位 報道 | 公眾號 QbitAI
最近NLP方向的資源越來越多,GitHub上又出現了一套新的課程,目前已經獲得了1300多顆星星。
在這套NLP課程中,作者們把這套課程拆分成了13周,從文本嵌入分類開始講,到Seq2Seq,再到機器翻譯、對話系統,內容豐富。
每周的課程除了主要的講座視頻之外,還有研討會部分,聽眾可以在研討會上用英文提問,已經講完的課程帶有視頻和Python筆記,另外還有課後作業筆記。
13周的課程
具體的課程時間表如下:
第一周
講座:介紹文本嵌入、分散式語義、LSA、Word2Vec、GloVe的用法和使用場景。
研討會:單詞和句子嵌入。
第二周
講座:文本分類。
文本表示的經典方法:BOW,TF-IDF。
神經方法:嵌入,卷積,RNN。
研討會:卷積神經網路的薪酬預測; 解釋網路預測。
第三周
講座:語言模型,N-gram和神經方法; 可視化訓練的模型。
研討會:使用語言模型生成ArXiv論文。
第四周
講座:
Seq2seq:編碼器 - 解碼器框架。
Attention:Bahdanau模型。
研討會:酒店和宿舍描述的機器翻譯。
第五周
講座:結構化學習,結構化感知器,結構化預測,RL基礎知識。
研討會:POS標籤。
第六周
講座:期望最大化和單詞對齊模型。
研討會:實現期望最大化。
第七周
講座:機器翻譯,回顧PBMT的主要思想,過去3年NMT開發的應用程序特定思想以及該領域的一些開放性問題。
研討會:學生演講。
第八周
講座:網路學習的內容和原因:「模型」永遠不僅僅是「模型」!NLP中的多任務學習,如何理解,模型表示包含哪些信息。
研討會:通過與其他任務共同學習,提高指定實體的認可度
第9~13周
第9~13周的內容作者們還沒有更新,根據目錄來看,主要是講域名適應、對話系統、對抗方法和TBA。
作者
這份NLP教程一共有5位作者,其中一作小姐姐Elena Voita是俄羅斯AI公司Yandex的研究員,專供NLP、機器翻譯方向,今年還發了一篇關於文本識別和機器翻譯的ACL論文。
Elena Voita目前在阿姆斯特丹大學讀機器學習、NLP方向的博士,同時還是愛丁堡大學訪問博士。
傳送門
GitHub:
https://github.com/yandexdataschool/nlp_course
Jupyter:
https://mybinder.org/v2/gh/yandexdataschool/nlp_course/master
—完—
年度評選申請
加入社群
量子位AI社群開始招募啦,歡迎對AI感興趣的同學,在量子位公眾號(QbitAI)對話界面回復關鍵字「交流群」,獲取入群方式;
此外,量子位專業細分群(自動駕駛、CV、NLP、機器學習等)正在招募,面向正在從事相關領域的工程師及研究人員。
進專業群請在量子位公眾號(QbitAI)對話界面回復關鍵字「專業群」,獲取入群方式。(專業群審核較嚴,敬請諒解)
活動策劃招聘
量子位正在招聘活動策劃,將負責不同領域維度的線上線下相關活動策劃、執行。歡迎聰明靠譜的小夥伴加入,並希望你能有一些活動策劃或運營的相關經驗。相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。
※對話搜狗口語機器翻譯團隊:全球奪冠只為驗證技術,更看重落地商用
※人工智慧還能怎麼玩?谷歌反手就是一個紅獅子雕塑
TAG:量子位 |