當前位置:
首頁 > 新聞 > 艾倫人工智慧研究院開源AllenNLP,基於PyTorch輕鬆構建NLP模型

艾倫人工智慧研究院開源AllenNLP,基於PyTorch輕鬆構建NLP模型

雷鋒網 AI科技評論消息,艾倫人工智慧研究院(AI2)開源AllenNLP,它是一個基於PyTorch的NLP研究庫,利用深度學習來進行自然語言理解,通過處理低層次的細節、提供高質量的參考實現,能輕鬆快速地幫助研究員構建新的語言理解模型。

AllenNLP能讓設計和評估新的深度學習模型變得簡單,幾乎適用於任何NLP問題,通過利用一些基礎組件,你可以輕鬆地在雲端或是你自己的筆記本上跑模型。

關於AllenNLP的詳細信息,可以參見論文AllenNLP: A Deep Semantic Natural Language Processing Platform,地址:http://allennlp.org/papers/AllenNLP_white_paper.pdf

模型對比

下面是AllenNLP模型與相關模型的對比,前者在合理的訓練時間下均能取的較好的表現:

機器理解

機器理解(Machine Comprehension,MC)模型通過在文本內選擇一段內容來回答自然語言問題。AllenNLP MC模型能重現BiDAF(Bi-Directional Attention Flow)的效果,後者在SQuAD數據集上跑分已經接近state-of-the-art。AllenNLP BIDAF在 SQuAD dev數據集中的EM分為68.7,只比原始BIDAF模型的67.7分多一點點,兩者同樣在p2.xlarge上訓練了4個小時。

語義角色標註

語義角色標註(Semantic Role Labeling,SRL)模型分析句子中各成分與謂詞之間的關係,建造表徵來回答關於句義的基本問題,如「誰對誰做了什麼」等。AllenNLP SRL模型能重現深度BiLSTM模型的效果,在CoNLL 2012上能得到78.9的F1分數。

文字蘊涵

文字蘊涵(Textual Entailment,TE)模型分析兩個句子,分析一個句子中是否蘊涵了另一個句子的知識。AllenNLP TE模型能重現可分解注意力模型的效果,後者在SNLI數據集上有接近state-of-the-art的表現。AllenNLP TE模型得到了84.7分,可以與可分解注意力模型得到的86.3分相提並論。

代碼地址:https://github.com/allenai/allennlp/archive/v0.2.0.zip(zip);

https://github.com/allenai/allennlp/archive/v0.2.0.tar.gz(tar.gz)

更多信息,可以查看:http://allennlp.org/

雷鋒網 AI科技評論編輯整理。雷鋒網。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 雷鋒網 的精彩文章:

民航業智能升級,安防巨頭『大華』如何利用 AI 保障機場安全
保險公司應用人工智慧,自身與AI供應商如何分工?
文檔亂、調試難…TensorFlow有那麼多缺點,但為何我們依然待它如初戀?
智能穿戴依舊火爆、家電智能白熱化、教育機器人興起|IFA 2017
iOS也不安全?高危漏洞威脅近半果粉!

TAG:雷鋒網 |