當前位置:
首頁 > 新聞 > 盤點NLP最新進展:多語種40+任務最優結果任你查

盤點NLP最新進展:多語種40+任務最優結果任你查

新智元報道

來源:nlpprogress.com

編輯:大明

【新智元導讀】本文是一個自然語言處理資源索引,涵蓋了目前NLP領域常用任務的最佳實驗 結果和數據集資源,可以作為進一步從事NLP研究的基礎。讀者也可以自行在Github頁面上添加新的結果,本文中大部分為英文NLP資源,還有少數漢語、印地語和越南語資源。

本文實際上是一個索引,旨在記錄自然語言處理(NLP)領域的新進展,並概述最常見的NLP任務及其相應數據集的新技術。

這篇索引旨在涵蓋主要的傳統和核心NLP任務,如語義依賴性解析和詞性標註等,以及最近不斷取得新突破的任務,比如閱讀理解和自然語言推理。本文主要目標是為感興趣的讀者提供關於NLP基準數據集的快速概覽,以及最新技術的進展,這些數據集和新進展可以作為進一步NLP研究的基礎。

因此,本文有意將這些NLP領域的新研究進展做一個簡單匯總,便於研究人員集中查閱參考。

讀者也可以通過瀏覽器訪問nlpprogress.com 或nlpsota.com來閱讀本文。

簡易使用指南

實驗結果

本文首選在已發表的論文中的實驗結果,但對少數影響力很大的預印本論文也可能入選。

數據集

本文中收錄的數據集,除了利用該數據集的論文之外,還應經過至少一篇已發表的其他論文的評估。

代碼

我們建議添加指向實現的鏈接(如果可用)。如果代碼不存在,您可以向表中添加代碼列(見下文)。在Code列,建議使用官方實現。如果有非官方實現,請使用鏈接(見下文)。如果沒有可用的實現,可以將單元格留空。

向本索引中添加新結果

如果要添加新結果,只需單擊文件右上角的小編輯按鈕以執行相應任務(如下圖所示)。

讀者可以在Markdown中編輯文件。只需以相同的格式將一行添加到相應的表中即可。確保表格中數據排序正確(將最佳結果位於頂部)。完成更改後,單擊頁面頂部的「預覽更改」選項卡,確保表格看起來還不錯。如果一切看起來都OK,請轉到頁面底部確認更改。

此處需要為建議更改添加名稱,可以選擇添加說明文字,可以選擇「創建新分支並啟動拉取請求」,然後單擊「提交更改」。

具體索引內容和研究領域如下,絕大部分為英語,有少量資源為漢語、印地語和越南語。

英語

自動語音識別

CCG超級標準

常識

選區解析

共同決議

依賴解析

對話

域適應

實體鏈接

語法糾錯

信息提取

語言建模

辭彙規範化

機器翻譯

多任務學習

多模態

命名實體識別

自然語言推理

詞性標註

問答

關係預測

關係提取

語義文本相似度

語義解析

語義角色標記

情緒分析

淺語法

簡單化

狀態檢測

概要

分類學習

時間處理

文字分類

詞義消歧

中文

實體鏈接

中文辭彙分割

印地語

分塊

詞性標註

機器翻譯

越南語

依賴解析

機器翻譯

命名實體識別

詞性標註

分詞

最後以」中文-辭彙分割」子類目為例,簡單說明這個索引資源的呈現方式。

點擊相應鏈接進入,首先是中文辭彙分割這個任務的簡要介紹。

下面列出了不同作者建立的基於不同搜索方式的單詞分割模型,以及相應模型的發表時間。

接下來是評估指標,此類中為F1分數。下面以表格形式給出每種模型在不同數據集上獲得的最佳F1分數。每個分數對應的研究論文鏈接和部分Github資源地址。

http://nlpprogress.com/

【加入社群】

新智元AI技術 產業社群招募中,歡迎對AI技術 產業落地感興趣的同學,加小助手微信號:aiera2015_2入群;通過審核後我們將邀請進群,加入社群後務必修改群備註(姓名 - 公司 - 職位;專業群審核較嚴,敬請諒解)。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

特朗普簽署美國AI國家計劃:凸顯「美國優先」,確保全球霸主地位

TAG:新智元 |