這個基於BERT的單模型，NLP權威測試全球第三！小i機器人押注認知智能再發威

新聞 08-21

新智元報道

編輯：木青、張佳

【新智元導讀】近日，憑藉自研BERT WWM MT的單模型，小i機器人在國際權威機器閱讀理解評測SQuAD1.1挑戰賽中排名全球第三。深耕行業18年，這家國產AI公司認為認知智能才是AI未來競爭的核心，並快速推進產業化應用——在商用智能客服領域，行業市場佔有率已超過80%。

一家中國人工智慧技術公司成立長達十八年之久，還在成長期趕上了第三次AI浪潮。

作為有著這樣背景的小i機器人對未來AI發展有著更成熟且明確的方向：

認知智能是人工智慧未來競爭的核心。

而認知智能技術需要多向積累，技術和應用互生互補。除18年產業應用經驗外，小i機器人在AI技術方面仍在不斷突破：

憑藉最新研究成果——BERT WWM MT的單模型，在由斯坦福大學發起的國際權威機器閱讀理解評測SQuAD1.1挑戰賽中排名全球第三，超越人類平均水平。不同於前兩名企業學校的聯合模式，小i完全是由研究院團隊獨立完成；

分別實現了基於機器學習和深度學習方法的各個NLP基礎能力模塊，覆蓋了詞法分析、句法分析、語義分析、篇章分析等基礎技術的能力；

參加情感計算國際標準建設，並在其中擔綱重要角色。

另外，不同於近幾年成立的AI公司，小i早就開始推進認知智能商業化——小i機器人以開闢智能客服這一典型AI應用場景為基礎，在金融、汽車、醫療等數個行業均有布局，其中商用智能客服領域，其行業市場佔有率已超過80%。

邁向認知智能的技術底氣：自研BERT WWM MT的單模型，NLP權威測試全球第三

現在大家習慣將人工智慧分為三個台階，計算智能、感知智能和認知智能，認知智能位於AI金字塔結構的頂部。

目前計算智能與感知智能，機器已經可以媲美甚至超越人類，但認知智能方面與人之間依然存在差距。

認知智能是人工智慧發展的未來趨勢。

認知智能涉及到語義理解、知識表達、聯想推理、智能問答、自主學習。人工智慧的一個重要目標就是希望機器能夠與人類進行更加自然高效的交流，希望機器讀懂人類深奧的語言，同時以一種我們習慣的方式進行交互。

其中，使機器讀懂人類深奧的語言、同時也是認知智能方面最典型的任務就是閱讀理解。

2019年7月，小i機器人研究院團隊在由斯坦福大學發起的國際權威機器閱讀理解評測SQuAD1.1挑戰賽中，憑藉最新研究成果——BERT WWM MT的單模型，以EM(精準匹配率)和F1(模糊匹配率)超越人類平均水平的優異成績排名第三。

此次在考慮Whole Word Masking的BERT預訓練模型基礎之上，小i引入輔助任務如NewsQA等數據集，採用多任務學習的思路來改進現有模型的效果，進一步提升模型的最終預測評價指標（主要為Exact Match和F1值）。

具體來看，小i分別對目標任務和輔助任務中的答案集合進行長度頻率統計，以及各自訓練一個語言模型，來綜合判斷輔助任務中的數據樣本與目標任務中的數據樣本之間的相關性。

最後將這個相關性指標進一步引入到模型訓練過程中損失函數Loss的計算過程中，以充分利用並學習到來自目標任務和有關輔助任務中的知識，從而最終提升模型的預測效果。

小i機器人蔘賽模型在此次比賽中獲得EM指標（精準匹配率）達到88.650，F1指標（模糊匹配率）達到94.393的成績。

排名前兩位的谷歌大腦和Facebook人工智慧研究部門都選擇了與高校聯手進行挑戰，而小i機器人則是完全獨立參加比賽。

SQuAD被譽為自然語言處理領域金字塔尖的比賽，旨在促進智能搜索引擎的發展。

國際機器閱讀理解評測SQuAD自2016年發布以來，共吸引了包括谷歌、微軟亞洲研究院、IBM研究院、阿里巴巴達摩院、上海交通大學等眾多國內外知名研究機構和高校參加。

而在實際應用中，小i也把機器閱讀理解的最新研究成果應用於有關產品和實際項目中。例如，在小i機器人開發的Bot開放平台中，集成了基於機器閱讀理解的能力。

除此之外，小i機器人分別實現了基於機器學習和深度學習方法的各個NLP基礎能力模塊，覆蓋了詞法分析、句法分析、語義分析、篇章分析的基礎技術的能力，上述的機器閱讀理解即為其中的能力之一。

小i機器人創始人、董事長兼CEO袁輝曾表示：感知、思考、運動三部分構成了人工智慧，其中最核心的是擁有思考力的「大腦」，也就是認知智能，它決定著人工智慧的水平高度。當機器的認知能力獲得重大突破，AI的應用度和滲透力就會更強。

小i機器人創始人、董事長兼CEO袁輝

正因如此，小i機器人一直堅持「大腦」研發。

目前，小i機器人已在上海、貴陽、深圳、南京、香港、美國矽谷設立6大研發中心，與華東師範大學、香港科技大學、中國科學院軟體所等建立聯合實驗室。在自然語言處理、深度語義交互、機器學習和大數據等認知智能相關以及圖像、語音識別等核心技術上擁有全面、自主的知識產權。

推動情感計算國際標準建設，將情感量化成機器能理解的數值

在認知智能中，除當下熱門的各項NLP能力外，小i機器人專攻另一獨特技術方向——情感計算，即將人類情感量化成機器可以理解的數值。

事實上，認知智能的發展分為語言理解、分析推理，以及人格和情感三個層次，情感可以說是AI金字塔頂尖中的頂尖，是AI最終需攻克的難關之一。

情感計算的概念早在1997年由MIT媒體實驗室Picard教授提出，她指出情感計算是與情感相關，來源於情感或能夠對情感施加影響的計算。

但在用戶界面中的對情緒交互信息的表示方式，仍缺乏規範化和統一的標準，使得人機交互中對用戶情緒信息的理解、處理，以及情緒的回饋呈現等過程存在差異，阻礙了情感計算用戶界面的應用和發展。

2013年著手研究情感計算以來，小i機器人在 2017年作為牽頭單位之一提交了國際上第一個有關情感計算的國際標準ISO/IEC 30150-1《信息技術情感交互第一部分：模型》，這也是中國在該領域的首個國際標準。此標準也在今年8月正式通過國際標準草案（DIS）投票。

事實上，情感計算的應用前景相當廣闊，用戶與計算機系統之間依然存在情緒和表達上的障礙，如果制定相關國際標準，將有利於實現情感計算用戶界面的應用推廣。

今年8月，小i機器人聯合中國電子技術標準化研究院和中國科學院軟體研究所三家共同提交了ISO/IEC 30150-11《信息技術情感計算用戶界面 Part 11:情緒表示》和ISO/IEC 30150-2 《信息技術情感計算用戶界面 Part 2:情感特性》。

深耕行業18載，崛起之路是偶然也是必然

認知智能技術需要多向積累，技術和應用互生互補，螺旋上升。小i很早就入局智能機器人行業，在這方面已有深厚的積累。

2001年，小i機器人在上海成立，但它最早出現在大眾視野是在2004年。那一年，小i機器人出現在MSN和QQ這兩大社交軟體上。憑藉此次合作，小i機器人用戶達到近一億人次，同時，此舉讓小i積累起了龐大的中文語義庫。從那以後，小i機器人開始進入聊天機器人和AI領域。

自2008年江蘇移動i8智能客服上線後，小i打開了企業智能客服的大門。

此後，小i在智能客服領域迎來爆發期，合作對象也拓展到聯想、聯通、建行、招行等大型互聯網、電信和金融機構。它們的機器人均使用了來自小i機器人的技術作為支撐。

除此之外，通過技術和資源的開放，小i還試圖激活AI時代開發者潛力，共享AI紅利，同時也使生態體系建設初具規模。

小i機器人發布了新一代智能Bot開放平台，集合了Chatting Bot、FAQ Bot、Discovery Bot三大核心能力以及深度學習、知識管理、知識學習、計算機視覺、知識融合等基礎能力。

目前，平台支持智能客服場景的直接使用，為企業和開發者提供機器人服務無縫轉人工服務以及通過智能學習構建知識庫的完整使用閉環。除此之外，企業和開發者還可通過標準介面獲得各類定製服務。

以智能客服為突破口，走出一條真正的「產業化之路」

在人工智慧的浪潮中，客服被認為是最先被取代的一類人群。傳統的人工客服往往都是高密集性勞動，而智能客服可很好地改進成本高、服務效率低等問題。

人工智慧技術有望在智能客服領域率先完成商業化落地。根據Gartner預測，2020年左右85%的客服服務都將由人工智慧完成。

在小i的生態產業落地領域當中，智能客服是主要業務方向之一。

據了解，小i機器人在智能客服實現過程中，技術層面主要分為三塊：一是自然語言處理和理解技術，二是需要機器人掌握根據上下文進行推理的能力，三是在不同領域中，利用人和機器的協作，半自動化地構建各行各業的知識體系。

作為國內智能客服領域的開拓者，小i在商用智能客服領域，行業市佔率已經超過了80%。

如今，小i機器人的業務涉及電信運營商、銀行、證券行業、互聯網金融、機場、電商、汽車、3C、醫院、房地產、酒店、手機、物流、餐飲等各行各業。

從技術、產品到解決方案、服務體系、再到生態建設，小i機器人這18年來穩紮穩打，為業界踏出了一條真正的「產業化之路」。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 新智元 的精彩文章:

※英國警方人臉識別系統錯誤率竟達81%，專家怒求下架
※800萬神經元，比CPU快1000倍！英特爾AI晶元系統模擬人腦重大突破

TAG:新智元 |