英特爾推出自然語言處理開源庫,代號「NLP Architect」
安妮 編譯整理
量子位 出品 | 公眾號 QbitAI
成立一年的英特爾AI Lab最近又有新動作。
幾天前,英特爾宣布推出開源庫NLP Architect——這是一個用於自然語言處理(NLP)的庫,幫助開發人員為聊天機器人和虛擬助手等會話應用提供所必需的功能,比如名稱實體識別,意圖提取和語義分析等,幫助智能體從對話中理解人類的行動。
推特網紅(((λ()(λ() 『yoav))))評論說,「這個開源庫提醒了我們,對於NLP中的許多用例(特別是當輸出空間很小的時候),用基於CPU的DyNet網路比在GPU上更有效」。
這到底是個怎樣畫風的開源庫?
NLP Architect概覽
在當前版本的NLP Architect中,研究人員從研究角度和實際應用兩個方向,賦予了它一些有趣的特性。包括:
NLP核心模型,它能對NLP工作流的語言特性進行魯棒性語音特徵的提取,例如依存句法分析器(BIST)和NP chunker。
性能最佳的NLU模塊,例如,意圖提取(IE)和命名實體識別(NER)
處理語義理解的模塊:例如colocations,NP嵌入表示(例如NP2V)等
用於會話人工智慧的組件:聊天機器人應用程序就是恰當的例子,包括對話框系統、序列組塊和IE
使用新拓撲結構的的端到端DL應用程序:比如Q&A和機器閱讀理解等
NLP Architect提供了上述所有模型的訓練和推理的端到端示例,還包括在部署這些模型時經常用到的功能,比如數據pipeline、公共功能的調用和與NLP相關的實用工具。
研究人員還介紹說,NLP Architect是模塊化的結構,易於集成。
模塊化的NLP Architect
這個開放而靈活的NLP組件庫為英特爾提供了與合作夥伴啟用NLP解決方案的基礎,此外,NLP Architect還提供了針對NLP工作負載的英特爾軟體和硬體的分析和優化的平台。其中一些組件,還提供了預訓練模型。
對了,這個存儲庫中使用了以下幾個開源的深度學習框架:
Intel neon
Intel Nervana graph
Tensorflow
Intel-Optimized TensorFlow
Keras
Dynet
可抱走的資料
開發人員可以從NLP Architect GitHub存儲庫中下載代碼,並按照指示安裝。在項目主頁中可以找到所有核心模塊和端到端示例的文檔。
英特爾官方博客:
https://ai.intel.com/introducing-nlp-architect-by-intel-ai-lab/
NLP Architect項目首頁:
代碼地址:
https://github.com/NervanaSystems/nlp-architect
作者系網易新聞·網易號「各有態度」簽約作者
—完—
活動報名
誠摯招聘
量子位正在招募編輯/記者,工作地點在北京中關村。期待有才氣、有熱情的同學加入我們!相關細節,請在量子位公眾號(QbitAI)對話界面,回復「招聘」兩個字。
※最強國產圍棋AI「鳳凰狗」正式開源,單塊GPU就能對弈職業九段
※官方還原Uber致命事故:人、車、自行車,傻傻分不清楚
TAG:量子位 |