自然語言處理論文10篇
1、Neural Personalized Response Generation as Domain Adaptation
【個性化】【對話生成】 本文研究的問題是如何生成個性化的對話,模型仍是基於經典的seq2seq+attention,在該模型的基礎上通過兩個步驟來生成特定style的對話,第一步是initialization,第二步是adaptation。工作來自哈工大 @劉挺 老師組,他們推出了一個聊天機器人 「笨笨」 (可微信搜),而且具有中文閱讀理解的功能。關於生成更多樣的對話內容,可以參考PaperWeekly 第十八期 --- 提高seq2seq方法所生成對話的流暢度和多樣性
2、RUBER: An Unsupervised Method for Automatic Evaluation of Open-Domain Dialog Systems
【對話系統】【評價】 本文研究的問題也是當前對話系統中非常關鍵的一個問題,如何更加準確地自動評價模型的效果,本文提出了一種新的評價方法RUBER,旨在通過生成的reply和用戶的當前query來聯合評判效果,建議從業者和相關研究人員精讀。
3、Generating Long and Diverse Responses with Neural Conversation Models
【對話生成】【seq2seq】 本文研究的問題是如何生成一個又長、又多樣的對話,模型仍是基於經典的seq2seq,在decoding部分,加了一個所謂的self-attention部件來保證對話長度和連貫性,在解空間中用隨機beam search來搜索候選對話,然後進行重排得到最終結果。
4、Decoding as Continuous Optimization in Neural Machine Translation
【seq2seq】【解碼】 本文的亮點在於將seq2seq模型中的解碼部分轉化成一個連續優化的問題,通過比較成熟的優化演算法來解決解碼問題,這個思路可以被應用到所有seq2seq解決方案中。
5、OpenNMT: Open-Source Toolkit for Neural Machine Translation
【NMT】【開源】 Harvard NLP組和SYSTRAN公司聯合推出的開源機器翻譯系統OpenNMT,torch實現,代碼地址:https://github.com/opennmt/opennmt主頁地址:http://opennmt.net/
6、Implicitly Incorporating Morphological Information into Word Embedding
【詞向量】將詞形信息考慮在詞向量模型中是一種常見的增強手段,一般的做法是將詞的前綴、後綴和詞根作為獨立的token進行建模,而本文的思路則是用能夠代表前綴、後綴意思的詞來代替進行建模。
7、Real Multi-Sense or Pseudo Multi-Sense: An Approach to Improve Word Representation
【真假多義詞】 詞向量是一個非常活躍的研究領域,word2vec提供了一種非常簡單粗暴、充滿問題的詞向量,比如一個典型的問題是一詞多義,於是很多的工作都是在解決一詞多義的問題,但一個詞對應的多個向量其實都指向同一個詞義,本文的工作正是對這些偽一詞多義進行識別,降低語言研究的複雜度。
8、Multi-level Representations for Fine-Grained Typing of Knowledge Base Entities
【entity表示】 entity是知識圖譜的基礎組件,很多的entity都是罕見詞(短語),entity的表示是一個相對困難的問題。本文提出了一種char-level、word-level和entity-level三種level的聯合表示模型,得到了不錯的效果。本文非常值得精讀!數據和代碼都已公開http://cistern.cis.lmu.de/figment/
9、Task-Specific Attentive Pooling of Phrase Alignments Contributes to Sentence Matching
【短語對齊】 本文研究的問題是句子匹配,該問題常常被應用於文本蘊含和答案選擇兩個任務上,針對短語識別、表示和對齊等關鍵問題,本文提出了一種基於GRU的NN模型,取得了不錯的效果。本文作者是@Wenpeng_Yin
10、Parsing Universal Dependencies without training
【依存分析】【無監督】 本文的工作是基於pagerank和一些規則來做無監督式的依存文法分析,無監督的paper總是讓人眼前一亮,EACL2017。」在現今去規則化和拼語料庫的機器學習型parser盛行時,少有的使用規則,無監督的Parser。每人研究都有自己支撐點,在沒有被完全推翻時,自然會堅持,不為熱潮激流所動,我認為這是理性研究者的主骨,我一直有敬畏之心。儘管各家學說各異,相信還是以結果優良和可發展性為最終評價標準」(觀點來自微博 王偉DL)
掃碼下載所有paper pdf
※本周「來聊」精選,看到年輕人的灼熱目光
※Science 等一周論文導讀(下)
※多模態機器翻譯論文推薦
※Science 等一周論文導讀(上)
※華中師範大學化學生物學研究中心研究助理招聘
TAG:科研圈 |
※自然語言處理論文推薦11篇
※自然語言處理論文筆記
※自然語言處理領域論文筆記
※自然語言處理領域歐洲頂級會議EACL 2017傑出論文出爐
※107篇論文被撤:有作者稱對論文撰寫投稿並不知情
※ACL 2017中國研究論文解讀:讀懂中國自然語言處理前沿進展
※ACL 2017中國研究論文解讀:讀懂中國自然語言處理前沿進展
※發表超過1450篇論文的怪才——「論文合作之王」
※107篇論文被撤:有通訊作者稱對論文撰寫投稿並不知情
※自然語言處理領域的前沿技術:EMNLP 2017最佳論文公布
※117篇撤稿論文,61份學術不端通報:「無賴性論文造假」太荒唐
※計算語言頂會ACL 2017開幕在即:國內接收論文梳理(5篇傑出論文)
※五部門通報107篇論文被撤稿:涉521名作者,正甄別處理
※論文稱T50隱身不如殲20,其實論文本身就有問題
※2016十大論文撤稿事件:學術界的醜聞與自凈
※2016 十大論文撤稿事件:學術界的醜聞與自凈
※資源:自然語言處理數據集、語料庫和論文集合
※要麼發表論文,要麼滅亡!218篇論文成就谷歌「AI奇蹟之年」
※ACL 2017 五篇最佳論文公布,國內無獲獎論文