當前位置:
首頁 > 新聞 > 「ACL 2017最佳論文解讀」NLP數據成熱點,哈佛教授獲終身成就獎

「ACL 2017最佳論文解讀」NLP數據成熱點,哈佛教授獲終身成就獎

「ACL 2017最佳論文解讀」NLP數據成熱點,哈佛教授獲終身成就獎

1 新智元報道

會議同時公布了「終身成就獎」——哈佛大學的 Barbara J. Grosz 教授,她在自然語言處理、多智能體系統等領域做出了開創性的貢獻。

【進入新智元公眾號,在對話框直接輸入 ACL2017 下載全部獲獎論文】

「ACL 2017最佳論文解讀」NLP數據成熱點,哈佛教授獲終身成就獎

最佳長論文:概率類型學:母音庫深度生成模型

「ACL 2017最佳論文解讀」NLP數據成熱點,哈佛教授獲終身成就獎

「ACL 2017最佳論文解讀」NLP數據成熱點,哈佛教授獲終身成就獎

摘要

語言類型學(Linguistic typology)研究的是人類語言中存在的結構範圍。該領域的主要目標是發現哪些可能的現象是普遍存在的,而哪些只是頻繁而已。例如,所有的語言都有母音,而大多數語言(而不是全部)都有 [u] 的發音。在本文中,我們針對語音類型學中基本的一個問題——什麼才算一個自然的母音庫?——給出了首個概率性的處理。我們介紹一系列深度隨機點過程(deep stochastic point processes),並將其與以前的計算方法和基於模擬的方法進行對比。我們提供了一整套超過 200 種不同語言的實驗。

「ACL 2017最佳論文解讀」NLP數據成熱點,哈佛教授獲終身成就獎

總結

為了分析語音類型學研究的數學基礎,我們提出了一系列點過程模型(point process models),用於母音系統庫(vowel system inventory)類型學的建模。所有的模型都另外被深度參數化(deep parameterization)來學習與認知科學中知覺空間相似的表示(representation)。此外,我們認為在語言類型學中,我們以前提出的概率建模比計算建模更好,我們認為概率建模是一種更自然的研究範式。此外,我們引入了幾個新穎的母音系統研究評估指標,希望這能引發對這一領域更多的興趣。這些指標的性能經過了 Becker-Kristal 語料庫的實證驗證,其中包括來自 200 多種語言的數據。

最佳短論文:從計算建模的角度看韻律和語域在詞語切分中的作用

「ACL 2017最佳論文解讀」NLP數據成熱點,哈佛教授獲終身成就獎

「ACL 2017最佳論文解讀」NLP數據成熱點,哈佛教授獲終身成就獎

摘要

本研究探討了詞語切分任務中語域(speech register)和韻律的作用。由於這兩個因素被認為在早期語言習得中具有重要的作用,我們的目標是量化這兩者對詞語切分任務的貢獻。我們研究了一個同時含有嬰兒和成人導向言語(infant- and adult-directed speech)的日語語料庫,並且在上面應用了 4 種不同的詞語切分模型,有擁有韻律邊界(prosodic boundaries)知識的,也有不含韻律邊界知識的。結果表明,語域(register)之間的差異比以前文獻報道過的要小,相比嬰兒導向言語,韻律邊界信息對成人導向的言語更有幫助。

「ACL 2017最佳論文解讀」NLP數據成熱點,哈佛教授獲終身成就獎

結論

我們檢查了在兩種匹配的自發 ADS 和 IDS 語料庫,以及一個更正式的 ADS 控制語料庫上 4 種不同的詞語切分演算法的性能,它們都具有和不具有韻律上的停頓(prosodic break)。我們發現,總體而言,sub-lexical 演算法的效果不如詞法演算法(lexical algorithms),IDS 整體上略微簡單或者等同於非正式的 ADS,本身比 ADS 簡單。此外,在所有演算法和語域中,我們觀察到韻律有助於進行詞語切分。

然而,韻律的影響是不平等的,並且與語域相互作用:韻律對 ADS 的幫助比對 IDS 的更多,當韻律被納入考慮時,自發的 ADS 和 IDS 產生了類似的得分。

這對語言習得理論有影響,因為 IDS 被認為是為嬰兒提供「超級言語」 (hyperspeech),也即簡化的語言習得的輸入。如果我們的觀察結果是真實的,就詞語切分而言,IDS 比 ADS 更容易切分,至少在嬰兒已經獲得使用韻律停頓的能力來控制(constrain)詞語切分的階段。當然,我們的觀察需要用其他語言和記錄過程(recording procedure)來確認和複製(replicate)。

總而言之,我們的研究表明了使用量化工具測試語言習得理論的作用。

最佳資源論文:一個用於視覺推理的自然語言語料庫

「ACL 2017最佳論文解讀」NLP數據成熱點,哈佛教授獲終身成就獎

「ACL 2017最佳論文解讀」NLP數據成熱點,哈佛教授獲終身成就獎

摘要

我們提出了一個新的用於視覺推理的語言數據集,包含92244對對應自然語句的合成圖像樣本,3962個不同句子。我們描述了眾包語言多樣性數據的方法,並提供對數據的分析。這些數據包含了視覺和集合推理所需的廣泛語言現象。我們用多種模型對數據進行了實驗,並提出這些數據可以作為未來研究的強有力挑戰。

「ACL 2017最佳論文解讀」NLP數據成熱點,哈佛教授獲終身成就獎

圖:我們的語料庫中的句子和圖像樣本。每個圖像包含三個不同類型的物體。上方的句子是真值,下方的是假值。

最佳演示論文:Hafez:一個互動式詩歌生成系統

「ACL 2017最佳論文解讀」NLP數據成熱點,哈佛教授獲終身成就獎

「ACL 2017最佳論文解讀」NLP數據成熱點,哈佛教授獲終身成就獎

摘要

Hafez 是一個能夠自動生成詩歌的系統,該系統結合了遞歸神經網路(RNN)和有限狀態接受器(FSA)。它能夠根據給定的任意主題生成十四行詩。此外,Hafez 允許用戶通過調整各種風格設置來修改和潤色生成的詩歌。實驗證明,這樣的「潤色」機制考慮了用戶的意圖,能夠產生更好的詩歌。在評估部分,我們構建了一個網路界面,用戶可以用1到5顆星為每首詩歌的質量進行評分。利用辭彙剪枝(vocabulary pruning)和GPU計算,我們將整個系統加快了10倍,從而能夠快速收集足夠的反饋。基於這些反饋,系統學習並調整其參數來提高生成詩歌的質量。

「ACL 2017最佳論文解讀」NLP數據成熱點,哈佛教授獲終身成就獎

圖1:Hafez 的整體架構

「ACL 2017最佳論文解讀」NLP數據成熱點,哈佛教授獲終身成就獎

圖2:(a)默認設置生成的詩歌;(b)用戶調整風格設置生成的詩歌

最佳演示論文提名:OpenNMT:神經機器翻譯開源工具包

「ACL 2017最佳論文解讀」NLP數據成熱點,哈佛教授獲終身成就獎

「ACL 2017最佳論文解讀」NLP數據成熱點,哈佛教授獲終身成就獎

摘要

本論文中,我們描述了神經機器翻譯(NMT)的一個開源工具包,該工具包是效率優先、模塊化而且可擴展,目的是支持NMT的模型結構、特徵表示、和源模式研究,同時保持具有競爭力的性能和合理的訓練要求。該工具包包括建模和翻譯支持,以及有關底層技術的詳細教學文檔。

「ACL 2017最佳論文解讀」NLP數據成熱點,哈佛教授獲終身成就獎

圖:神經機器翻譯的示意圖。紅色框的源詞先被映射到詞向量,然後饋入一個遞歸神經網路(RNN)。當看到<eos>符號時,最後一個時間步長初始化一個目標RNN(藍色)。在每個目標時間步長,attention被應用於源RNN,並與當前隱藏的狀態結合,產生下一個詞的預測。這個預測接著被饋入目標RNN。

終身成就獎:人工智慧協同規劃與人機交互

會上還同時公布了「終身成就獎」(Lifetime Achivement Award)——哈佛大學的 Barbara J. Grosz 教授上台領獎並發表了獲獎感言。

「ACL 2017最佳論文解讀」NLP數據成熱點,哈佛教授獲終身成就獎

Barbara J. Grosz 教授發表獲獎感言

計算機科學的一個主要挑戰是為易於使用、大規模的信息系統創建其科學和技術基礎。人工智慧研究的目的是理解使計算機系統的構造能夠智能地行動的方式,並構建這樣的系統。Grosz 教授的研究關注這兩大議題,旨在開發計算機智能系統在長期、不確定、動態的環境中發揮作用所需的能力。Grosz教授的研究項目已經提出構建能夠相互合作或與用戶一起工作的系統的協同理論和模型。對於構建有用的助理,而不僅僅是工具,協同的能力是至關重要的。更好的人機交互,包括適當地處理中斷,是這一挑戰的重要部分。

Grosz 教授在自然語言處理、多智能體系統等領域做出了開創性的貢獻。她開發了最早的一些人機對話系統,確立了語篇計算建模的研究領域。她在協同模型方面的工作幫助確立了這一研究領域,並提出了幾個協同多智能體和人機交互界面的框架。目前,Grosz 教授的研究重點是探討協同多智能體系統和協同界面改善醫患交流的方式。

Grosz 是美國國家工程學院院士,美國哲學學會、愛丁堡皇家學會、美國藝術與科學學院的成員,以及美國人工智慧協會(AAAI)、美國計算機協會和美國科學促進協會的會士。Grosz 由於在「自然語言處理研究和多智能體系統的基礎性貢獻,在人工智慧領域的領導作用,以及建設和領導跨學科機構的領導作用」,在2009年獲得ACM/ AAAI Allen Newell Award。2015年,她被授予 IJCAI 終身成就獎,以表彰她在「自然語言處理和多智能體系統的理論和應用的開拓性研究」。

Grosz 在跨學科機構方面的領導作用也很傑出,並由於促進女性在科學領域地位的貢獻受到廣泛尊重。從2007- 2011年,Grosz 教授擔任哈佛大學拉德克利夫高等研究院臨時院長和院長。

點擊閱讀原文可查看職位詳情,期待你的加入~

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

「Kaggle 實戰分享」谷歌 YouTube-8M 大規模視頻理解競賽技術剖析
闢謠:Facebook機器人發明語言系誤讀,專家訪談還原真相
全自動機器學習:ML 工程師屠龍利器,一鍵接收訓練好的模型
谷歌IPO之路:上市13年後,谷歌成為利潤機器
「谷歌IPO之路」上市13年後,谷歌成為利潤機器

TAG:新智元 |

您可能感興趣

直擊2019 ECCO-何瑤教授為您解讀最新IBD熱點
LáSZLóG.BOROS教授將受邀在「2018年ICC&CMT&NCCM」做主題演講
ICRA 2017 大會主席陳義明教授專訪:論道機器人、AI 與工業之淵源 | CCF-GAIR 2019
IEEE 計算機學會 2019 年 Edward J.McCluskey 技術成就獎揭曉,周志華教授成唯一獲獎者
「CSCO2018」秦叔逵教授解讀2018版CSCO肝癌診療指南亮點
馮百歲教授為您解讀2019 AOCC 「IBD治療優化」相關進展
祝賀!侯明教授論著入選Blood雜誌2017 TOP10!
JCO I Nivolumab給晚期肺癌患者帶來長期生存獲益:來自CA209-003研究的完整數據 I 楊農教授點評
他破解世界數學難題,獲100萬獎金,22歲成985大學教授!
從最新血脂進展看極高危患者LDL目標值:黃慧玲教授在FAITH2018湛江行的授課
發表SCI論文100餘篇,被國際同行引用600多次,這位老教授把數學課上出了花
快訊:剛剛,張成奇教授當選為2024年IJCAI 大會主席
16歲上哈佛,25歲榮升教授,卻在36歲成為美國FBI的噩夢
22歲成中南大學教授級研究員,並獲100萬重獎
彭莉教授:TMB+PD-L1有望成為I/O優勢人群篩查的黃金組合
CDS2018:陳莉明教授解讀中國 FGM 臨床應用專家共識
IJCAI 50年來首位華人大會主席!張成奇教授當選
「404教授」遭全網曝光?自撤120篇論文,卻被爆出更多黑料...
2017圖靈獎頒發,美兩教授獲獎
中山大學陳瑤生教授團隊培育出首例CD163受體SRCR5結構域LBP缺失抗PRRSV基因編輯豬