ACL最佳論文出爐，十四行詩生成、OpenNMT、概率類型學等上榜

知識 08-03

李林編譯出品

量子位報道 | 公眾號 QbitAI

今天，2017年度計算語言學協會年會（ACL）評出了5篇最佳…論文，量子位整理介紹如下：

最佳演示論文：

Marjan Ghazvininejad, Xing Shi, Jay Priyadarshi, Kevin Knight,

Hafez: an interactive poetry generation system

論文：

http://xingshi.me/data/pdf/ACL2017demo.pdf

代碼：

https://github.com/shixing/poem

這篇論文描述了一個由循環神經網路（RNN）和有限狀態接收器（Finite State Acceptor, FSA）構成的自動詩歌生成系統「Hafez」，可以根據任意主題生成十四行詩。用戶還能通過調整風格配置，來修改、潤色這些詩歌。

論文的四位作者是南加州大學武凱文（Kevin Knight）教授和他的學生Marjan Ghazvininejad、史興、Jay Priyadarshi。

他們去年就在EMNLP上發表了一篇生成詩歌的論文：Generating Topical Poetry; Marjan Ghazvininejad，還把詩歌生成軟體做成了一個Alexa Skill（https://www.amazon.com/USC-Custom-Poetry/dp/B06X9HNFGC）以及一個網頁Demo（http://52.24.230.241/poem/）

最佳演示論文第二名：

Guillaume Klein、Yoon Kim、Yuntian Deng、Jean Senellart、Alexander Rush

OpenNMT: Open-Source Toolkit for Neural Machine Translation

論文：

https://arxiv.org/abs/1701.02810

項目主頁：

http://opennmt.net/

代碼：

https://github.com/OpenNMT/OpenNMT

這篇論文由哈佛大學和機器翻譯公司SYSTRAN聯合發表，他們的OpenNMT是一個開源的神經機器翻譯系統。

最佳資源論文：

Alane Suhr, Mike Lewis, James Yeh, Yoav Artzi,

A Corpus of Natural Language for Visual Reasoning

論文：

http://yoavartzi.com/pub/slya-acl.2017.pdf

項目主頁：

http://lic.nlp.cornell.edu/nlvr/

數據集：

https://github.com/clic-lab/nlvr

這篇論文由康奈爾大學和Facebook AI研究院共同發表，給出了一個新的視覺推理語言數據集，其中包括92244對自然語言陳述和生成圖片，以及3962個句子。

ACL 2017的程序委員會這樣評價這篇論文：

我很欣賞這篇論文中的sanity check，它確保了在不理解這些數據集的情況下，無法解決相關問題。

最佳短論文：

Bogdan Ludusan, Reiko Mazuka, Mathieu Bernard, Alejandrina Cristia, Emmanuel Dupoux,

The Role of Prosody and Speech Register in Word Segmentation

論文：

http://aclweb.org/anthology/P17-2028

這篇論文由法國巴黎高等師範學院、法國高等社會科學院和日本理化學研究所共同完成，探索了語體和韻律在段詞中的作用，結果顯示，語體的作用比此前熱門所認為的要小，而韻律邊界信息在成人語言中比在嬰兒語言中發揮著更大的作用。

眾所周知，把研究結果寫成短論文很難。在委員們推薦的論文中，只有這一篇符合程序委員會的「最佳短論文」標準：

（a）是作為短論文而寫的，不是省略了細節的長論文;

（b）包含論文中應該包含的所有元素；

（c）作為一篇短論文，它是「最好的」。

最佳長論文：

Ryan Cotterell, Jason Eisner,

Probabilistic Typology: Deep Generative Models of Vowel Inventories

論文地址：

https://arxiv.org/abs/1705.01684

這篇論文來自康奈爾大學，將統計學方法引入類型學研究，用來解答這個經典的問題：一個自然的母音清單的如何形成的？

語言類型學研究人類語言中的各種不同結構，探索哪些結構、現象是各種語言的共性，哪些是很少出現的。母音清單就是其中的問題之一：所有語言都有母音，但並不是所有語言都包含u這個音。

程序委員會將這篇論文選為「最佳長論文」，是因為它將「古典」生成模型和神經網路結合起來，探索負責的語言學問題。

論文的第一評審這樣評價它：

我對這篇文章印象深。它以微妙而恰當的方式使用了現代的深度學習工具。這篇論文為了達到前人方法未能完成的明確目標，而進行了計算。

現在，我們可以評估一個完整的母音清單出現的概率，而不再局限於根據一個母音來猜測另一個母音出現的可能性。

——完——

量子位QbitAI

? ? ? 追蹤AI技術和產品新動態

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 量子位 的精彩文章:

※研究發現人工誘導地震與天然地震「不可區分」
※放大1000萬倍，帶你領略人體內的微觀世界
※這家人工智慧AR明星製作公司獲得騰訊500萬美元投資
※Keras作者、谷歌研究員Chollet：深度學習的理論局限
※用演算法做服裝設計：從30億款女式襯衫中找出最受歡迎的9種

TAG:量子位 |

您可能感興趣

※Coinbase上市概率大比拼，ATOM、ONT、DCR誰將稱王？
※張鈸、朱軍團隊最新論文：深度隱式模型 + 概率圖模型 = Graphical-GAN
※張鈸、朱軍團隊最新論文：深度隱式模型＋概率圖模型＝Graphical-GAN
※這款 FOG 聯名入手概率更高！FOG x Converse Chuck 70 本周發售
※韓援Easyhoon離隊大概率離開LPL重回LCK
※PyTorch深度概率推斷工具Brancher，掌握ML和Python基礎即可上手
※DOTA2：說在Major震中杯前，中國軍團奪冠概率分析
※EOS是目前看來成功概率最大的DApp？
※對新手友好的PyTorch深度概率推斷工具Brancher，掌握ML和Python基礎即可上手
※Edward2.2，一種可以用TPU大規模訓練的概率編程
※Rekkles：EDG很有可能進C組，那麼TL大概率會被捶回家！
※NIPS 2018：谷歌大腦提出簡單、分散式概率編程，可用TPU大規模訓練
※OFF-White x Nike 依舊強勢霸榜，而奢侈品牌球鞋出現概率也在逐漸增大
※OSIRIS-REx團隊公布Bennu小行星近照撞地概率1/2700
※代工廠暗示：iPad mini 5大概率春季更新
※BUMO李思成：三分之二的商業體不適合做區塊鏈，Fcoin模仿者大概率在自尋死路
※LPL夏季賽7月20日RNG對陣EDG MLXG大概率宣布退役
※NBA奪冠概率排行榜出爐！ESPN：火箭第一，騎士竟降至0.1％
※科技來電：魅族兩款新機通過核准認證，大概率為16sPro和16XsPro
※資源 | 概率編程工具：TensorFlow Probability官方簡介