ACL最佳論文出爐,十四行詩生成、OpenNMT、概率類型學等上榜
李林 編譯出品
量子位 報道 | 公眾號 QbitAI
今天,2017年度計算語言學協會年會(ACL)評出了5篇最佳…論文,量子位整理介紹如下:
最佳演示論文:
Marjan Ghazvininejad, Xing Shi, Jay Priyadarshi, Kevin Knight,
Hafez: an interactive poetry generation system
論文:
http://xingshi.me/data/pdf/ACL2017demo.pdf
代碼:
https://github.com/shixing/poem
這篇論文描述了一個由循環神經網路(RNN)和有限狀態接收器(Finite State Acceptor, FSA)構成的自動詩歌生成系統「Hafez」,可以根據任意主題生成十四行詩。用戶還能通過調整風格配置,來修改、潤色這些詩歌。
論文的四位作者是南加州大學武凱文(Kevin Knight)教授和他的學生Marjan Ghazvininejad、史興、Jay Priyadarshi。
他們去年就在EMNLP上發表了一篇生成詩歌的論文:Generating Topical Poetry; Marjan Ghazvininejad,還把詩歌生成軟體做成了一個Alexa Skill(https://www.amazon.com/USC-Custom-Poetry/dp/B06X9HNFGC)以及一個網頁Demo(http://52.24.230.241/poem/)
最佳演示論文第二名:
Guillaume Klein、Yoon Kim、Yuntian Deng、Jean Senellart、Alexander Rush
OpenNMT: Open-Source Toolkit for Neural Machine Translation
論文:
https://arxiv.org/abs/1701.02810
項目主頁:
http://opennmt.net/
代碼:
https://github.com/OpenNMT/OpenNMT
這篇論文由哈佛大學和機器翻譯公司SYSTRAN聯合發表,他們的OpenNMT是一個開源的神經機器翻譯系統。
最佳資源論文:
Alane Suhr, Mike Lewis, James Yeh, Yoav Artzi,
A Corpus of Natural Language for Visual Reasoning
論文:
http://yoavartzi.com/pub/slya-acl.2017.pdf
項目主頁:
http://lic.nlp.cornell.edu/nlvr/
數據集:
https://github.com/clic-lab/nlvr
這篇論文由康奈爾大學和Facebook AI研究院共同發表,給出了一個新的視覺推理語言數據集,其中包括92244對自然語言陳述和生成圖片,以及3962個句子。
ACL 2017的程序委員會這樣評價這篇論文:
我很欣賞這篇論文中的sanity check,它確保了在不理解這些數據集的情況下,無法解決相關問題。
最佳短論文:
Bogdan Ludusan, Reiko Mazuka, Mathieu Bernard, Alejandrina Cristia, Emmanuel Dupoux,
The Role of Prosody and Speech Register in Word Segmentation
論文:
http://aclweb.org/anthology/P17-2028
這篇論文由法國巴黎高等師範學院、法國高等社會科學院和日本理化學研究所共同完成,探索了語體和韻律在段詞中的作用,結果顯示,語體的作用比此前熱門所認為的要小,而韻律邊界信息在成人語言中比在嬰兒語言中發揮著更大的作用。
眾所周知,把研究結果寫成短論文很難。在委員們推薦的論文中,只有這一篇符合程序委員會的「最佳短論文」標準:
(a)是作為短論文而寫的,不是省略了細節的長論文;
(b)包含論文中應該包含的所有元素;
(c)作為一篇短論文,它是「最好的」。
最佳長論文:
Ryan Cotterell, Jason Eisner,
Probabilistic Typology: Deep Generative Models of Vowel Inventories
論文地址:
https://arxiv.org/abs/1705.01684
這篇論文來自康奈爾大學,將統計學方法引入類型學研究,用來解答這個經典的問題:一個自然的母音清單的如何形成的?
語言類型學研究人類語言中的各種不同結構,探索哪些結構、現象是各種語言的共性,哪些是很少出現的。母音清單就是其中的問題之一:所有語言都有母音,但並不是所有語言都包含u這個音。
程序委員會將這篇論文選為「最佳長論文」,是因為它將「古典」生成模型和神經網路結合起來,探索負責的語言學問題。
論文的第一評審這樣評價它:
我對這篇文章印象深。它以微妙而恰當的方式使用了現代的深度學習工具。這篇論文為了達到前人方法未能完成的明確目標,而進行了計算。
現在,我們可以評估一個完整的母音清單出現的概率,而不再局限於根據一個母音來猜測另一個母音出現的可能性。
——完——
量子位QbitAI
? ? ? 追蹤AI技術和產品新動態
※研究發現人工誘導地震與天然地震「不可區分」
※放大1000萬倍,帶你領略人體內的微觀世界
※這家人工智慧AR明星製作公司獲得騰訊500萬美元投資
※Keras作者、谷歌研究員Chollet:深度學習的理論局限
※用演算法做服裝設計:從30億款女式襯衫中找出最受歡迎的9種
TAG:量子位 |
※Coinbase上市概率大比拼,ATOM、ONT、DCR誰將稱王?
※張鈸、朱軍團隊最新論文:深度隱式模型 + 概率圖模型 = Graphical-GAN
※張鈸、朱軍團隊最新論文:深度隱式模型+概率圖模型=Graphical-GAN
※這款 FOG 聯名入手概率更高!FOG x Converse Chuck 70 本周發售
※韓援Easyhoon離隊 大概率離開LPL重回LCK
※PyTorch深度概率推斷工具Brancher,掌握ML和Python基礎即可上手
※DOTA2:說在Major震中杯前,中國軍團奪冠概率分析
※EOS是目前看來成功概率最大的DApp?
※對新手友好的PyTorch深度概率推斷工具Brancher,掌握ML和Python基礎即可上手
※Edward2.2,一種可以用TPU大規模訓練的概率編程
※Rekkles:EDG很有可能進C組,那麼TL大概率會被捶回家!
※NIPS 2018:谷歌大腦提出簡單、分散式概率編程,可用TPU大規模訓練
※OFF-White x Nike 依舊強勢霸榜,而奢侈品牌球鞋出現概率也在逐漸增大
※OSIRIS-REx團隊公布Bennu小行星近照 撞地概率1/2700
※代工廠暗示:iPad mini 5大概率春季更新
※BUMO李思成:三分之二的商業體不適合做區塊鏈,Fcoin模仿者大概率在自尋死路
※LPL夏季賽7月20日RNG對陣EDG MLXG大概率宣布退役
※NBA奪冠概率排行榜出爐!ESPN:火箭第一,騎士竟降至0.1%
※科技來電:魅族兩款新機通過核准認證,大概率為16sPro和16XsPro
※資源 | 概率編程工具:TensorFlow Probability官方簡介