蘇寧李偉:蘇寧機器人平台會話商務系統實踐
本文根據【創客168】第12期《人工智慧技術與智慧辦公》現場演講嘉賓李偉老師分享內容整理而成,文字整理@IT168鈺瑩
講師簡介
▲李偉
李偉,清華大學人工智慧方向博士,在數據、演算法、架構等方面擁有多年經驗,曾任雅虎公司科學家,負責個性化首頁、推薦、廣告等演算法業務;百度資深工程師,負責貼吧、知道等相關演算法。目前擔任蘇寧技術研究院人工智慧實驗室技術總監,兼北京負責人,主要負責智能機器人平台,主導智能商務、智能家居等智能渠道業務的研發工作。之前分別在Intel、微軟公司實習和工作,對機器學習、數據挖掘、自然語言處理、深度學習和計算機視覺等有著豐富的經驗,目的是利用人工智慧技術助推智慧零售。
正文
大家好,我是蘇寧技術研究院北京分院的負責人李偉,我今天分享的主題是《蘇寧機器人平台——會話商務系統實踐》,主要分為以下幾個部分:
第一部分:回顧什麼是會話系統;第二部分:介紹基於搜索的問答系統基本架構;第三部分:基於槽填充模型的意圖理解;第四部分:基於回歸模型的智能客服系統,三、四兩部分目前已成功集成到蘇寧智能家居以及內部員工財務、IT等平台,之後將逐步推廣到易購客服系統;第五部分:蘇寧目前採用的人機協同基本架構是AI+HI,大部分情況下,在線和離線數據標註都需要人工參與,整個會話系統架構離不開數據積累,因此不完全是AI或AI-First戰略;最後是蘇寧智能機器人平台的簡單架構介紹。
首先回顧信息檢索的趨勢變化。目前,會話系統、自動問答系統的很多架構以及數據都源於信息檢索系統。
七十年代,人們非常熟悉圖書館檢索,根據書號尋找並借閱自己感興趣的書。九十年代,互聯網興起,第一批互聯網還未出現檢索系統,美國雅虎最開始做3W,但這並不是檢索系統而是以分類方式給用戶提供便利的信息訪問,當用戶想尋找某類信息時,首先進入大眾分類體系,逐級向下查詢所需信息,但這種方式存在明顯的弊端,該分類體系難以創建,若作為靜態結構又難以維護,當長尾信息非常多的時候難以分類,通過人工維護也相當不方便,這讓雅虎、谷歌、百度都投身於搜索引擎研發之中,自動問答會話系統的雛形應運而生。2015年,隨著大數據時代的到來以及深度學習的發展,會話系統以及整個會話時代才慢慢開啟。
問答系統的基本定義是機器或者某個程序自動回答用戶問題,問答系統的類型大概分為以下維度:一是根據問題類型劃分,比如事實類問題、觀點類問題,是否類問題等,二是根據內容劃分,分成文本會話系統以及可視化會話系統。實際上,自動問答基本是會話系統背後的核心技術,會話系統中的很多架構以及演算法都是從自動問答里借鑒過來的。以下是問答系統的基本架構:
用戶提出問題之後,系統會首先有一個Query understanding的過程,這之中可能涉及問題的擴展以及意圖理解,接下來會同時做問題的類型檢測和判斷,為什麼要同時做這兩件事情呢?比如,用戶想買蘋果手機,系統反饋回來的是一箱富士蘋果的價錢,用戶會覺得非常不相關。所以,首先要判斷問題類型,判斷屬於數碼手機還是水果,接下來做一系列和檢索系統或模型相關的事情。
常見的檢索排序模型有文檔檢索、相關文檔抽取、段落檢索等,我們從中獲取想要的答案再返回給用戶,這是目前比較常用的一套Q&A架構。
當前會話系統基本可分為兩類,一類是閑聊陪伴機器人,可以與用戶在某個特定或開放領域內自由聊天,比如微軟小冰;一類是面向任務的機器人,幫用戶解決特定領域的任務,比如蘋果的Siri。當然,這之間的界限並不是特別清晰,也有很多機器人是混合型的,兩種功能都具備。
以上是Task Bot的架構,很多Task Bot不具備語音識別功能,蘇寧的Task Bot具備該功能,同時可通過文本方式完成用戶需求。如果用戶通過語音會話系統提出需求,第一步就進行語音識別,這就存在一個識別準確性的問題,如果識別有誤,我們將進行語意糾錯。如果識別正確,則繼續執行。
接下來就是理解部分,這包括三部分內容:一是領域分類,二是用戶意圖理解,三是槽填充模型,最後會識別成用戶所需要的語意框架模型。之後,主要是會話管理,對會話狀態進行跟蹤,根據當前狀態及所觀測的用戶行為決定會話系統的下一步動作。然後是NLG(Natural language Generation),根據模板生成一段自然語言返回給用戶,以響應用戶發出的指令。
例如,用戶希望機器人播放本周比較流行的爵士樂,機器人通過語音識別了解用戶需求,在識別正確的情況下,繼續理解用戶意圖。領域分類明顯屬於音樂播放,用戶意圖是爵士樂,接下來運用槽填充模型完善所需屬性,在音樂庫中對條件進行檢索,最後返回給用戶。
接下來,我們進行簡單細化。當然,重點是談NLU用戶意圖理解部分,包括三大子模塊:領域分類、意圖理解、槽填充模型。在講整個NLU用戶意圖理解之前,我們首先看一下語意框架模型:
假設用戶需求是:買一個黑色的、適用於男性用戶的蘋果手機。
首先識別用戶意圖是購物,品牌是蘋果,顏色是黑色,適用人群是男性,我們將這些屬性填充到對應的槽值中,當然具體商品可能不止這三個屬性,我們可以通過多輪交互的方式明確用戶需求,在滿足條件之後觸髮結束當前場景,調用搜索系統,把相關產品推薦給用戶。
領域分類實際上是比較直接的,分類模型很大程度上依賴於人工標註的領域知識庫,我們根據用戶話術明確用戶需求,領域分類完成以後就是意圖理解部分。
然後是槽填充,通過用戶需求和多輪互動的方式完成屬性的槽填充,用戶完全通過文本或自然語言的方式描述需求,相對之前的方式提供了一些便利,但這種方式一旦理解不精準就會產生很大偏差,目前蘇寧也在不斷開發和優化過程中。
接下來具體介紹一下槽填充模型,槽填充模型類似信息和關係抽取,這是自然語言數據里的經典任務,定義是在給定的實體或具體任務里把丟失的信息和屬性回填上去,基本完成的事情是entity/task,slot和filler,entity/task可以是一個實體也可以是具體任務,針對任務和實體會有一些待填充的槽,目的是通過會話系統用filler把槽填充完成。我們在設計會話系統時,會收集用戶信息再將信息返回給用戶進行確認,這就是一個簡單的slot filling的例子。
這種槽填充模型的應用場景非常廣泛,我們希望通過單輪或多輪交互以及會話系統將槽填充完成。而這種會話系統在其他領域也可以用到,比如,在商品領域中,我們會用到屬性填充以及屬性糾錯。
當我們發現某件商品的屬性在易購或京東上有缺失,而在天貓上比較完備時,我們會將天貓上的屬性抓取過來,與易購或京東上的商品進行匹配,若匹配成功,則將缺失屬性回填上去,這就是槽填充模型的具體應用。該模型還可應用於實體畫像的完善,比如,當我們百度「劉德華」時,發現其在搜搜問問中的畫像不是很完整,而在知乎或其他地方可提取到缺失屬性,經匹配成功後便可填充到缺失的槽中。
槽填充模型的具體方法分為很多種,一類是完全基於模板匹配,這些模板是固定的響應模板,比如我喜歡、我想聽某類人的歌,如果判定屬於該模板,則只需將缺失的歌手信息填充進去即可,這類方法的使用也比較廣泛。另一類是將其形式化成序列標註任務,該方法會將每個詞都打上標籤,比如,給我買一張明天一早從北京到上海的機票,用戶意圖識別為買機票,待填充的槽值為起始時間、起始地點。在不確定用戶具體時間的情況下,機器會給出明天一早從北京到上海的所有航班信息,詢問用戶的具體選擇。
當然,在某些情況下,既可以當作序列標註的任務去做,也可以當分類任務進行分解,將具體的詞用序列標註的方式打標籤,這是傳統分類模型的任務。用分類模型對對應的槽和值做交叉組合,可以運用一些回歸或向量積的方式解決槽與值之間的匹配問題。
蘇寧目前基於語意框架模型,slot filling技術已經實現了蘇寧智能家居中的家電控制和場景控制,蘇寧現在可控制大概十五種家電設備,後續還在不斷擴充。目前的QPS非常短,響應時間在三毫秒以內,同時準確率和召回率也非常高,我們有部分用到了語音識別,但效果並不是特別好,影響了家電控制的準確率。
以上是蘇寧家電控制的演示圖,比如,將空調調成20度,控制設備是空調,具體動作是調溫。解析結果中的對應設備類型是空調,給用戶返回TTS,完成需求之後會給用戶響應,通過文本或語音合成方式告知用戶具體行為。
接下來是智能客服領域,目前來說該領域2B的應用場景非常多,比如,銀行和電商平台的智能客服,智能客服的目的不是為了替代人工客服,而是在特定場景和領域下幫助人工客服更好地完成用戶需求。
智能客服的幾種應用場景如下:一是機器人優先模式,在任何情況下,機器人都先於人工客服回答用戶問題;二是機器人輔助應答模式,無論人工客服是否繁忙,機器人都不優先回答客戶問題,而是將答案優先返回給人工客服,由人工客服來判斷答案好壞,選擇是否直接將答案返回給用戶,這在一定程度上緩解了人工客服的壓力,同時保證了服務質量;三是排隊,在人工客服繁忙時,機器人優先接入;四是離線,當人工客服處於離線狀態時,可接入機器人及時回答用戶問題。
以上是蘇寧基於回歸模型搭建智能客服的簡單例子。首先,我們把問題形式化成回歸模型,對問題進行分類,比如有標準問、相似問等,還有答案以及話術具備的標籤。這是蘇寧內部員工平台的簡單客服,基於一些具體數據,用一個二分類的回歸模型訓練智能客服模型,具體架構大概如下:
具體問題中也包括一些相似問,我們可對數據進行篩選,提取不相關的非相似問,經過預處理、特徵提取和選擇以後,再訓練模型,問題和相似問的標籤是1,問題和非相似問的標籤是0,我們可以訓練一個binary regression模型。
該模型目前在蘇寧內部的應用效果還是不錯的,機器交互的優點也很明顯,7*24小時在線的同時還滿足高並發需求。但是,當詢問某類問題的員工較多時,還是會出現延遲。
智能客服在蘇寧內部提供的服務包括IT服務、財務服務還有人事服務,目前的準確率和召回率尚未達到滿意的程度,蘇寧後期將會持續優化。
以上是蘇寧內部的智能機器人服務號,它具備閑聊陪伴、互動聊天和百科問答等功能,也涉及一些簡單的購物場景,購物場景將涉及多輪交互,目前還未完全開發完畢。
蘇寧內部提出了一個AI+HI=MI的觀點,這裡的MI指的是Mix Intelligence,實際上目前大部分人工智慧應用都離不開人的參與,智能化離不開協同化,這裡涉及人機協同,比如在線和離線數據標註,都需要很多人工參與,不斷循環迭代。HI的參與讓AI得以不斷完善,AI完全依靠演算法優化以及冷啟動策略是很難快速成長起來的。以下是蘇寧內部智能機器人平台的基本架構:
該架構底層是基本數據層,我們可能會爬取很多百科、競品或社區數據;第二層是知識庫和知識圖譜層;第三層是整個智能機器人平台的核心層;最後是技能層,該層會對家庭機器人、金融機器人、財務機器人和直播機器人進行劃分。蘇寧目前有六大產業,基本涵蓋了雲商、置業、文創、投資地產等,實際上很多場景均可接入智能機器人。
以上是智能助理的簡單架構,分為響應型助理和主動型助理,響應型助理需要人為喚醒,比如雲之聲的魔方, 需要用戶語音「魔方魔方」來喚醒,喚醒之後才可完成某項特定任務,其餘時間不會主動騷擾用戶,這是響應型機器人。
主動型機器人會對前期對話進行記錄,主動跟進並與用戶溝通,比如,你向機器人傾訴與女朋友吵架了,過幾天,機器會主動詢問你與女朋友的關係是否有改善。這類機器人會主動與用戶聊天,但存在是否騷擾到了用戶生活的問題。因此,該功能的投放會更加謹慎。
我今天的分享到此結束,謝謝大家!
※語不驚人誓不休 黃允松QingCloud Insight語錄
※蘇寧易購818,小編帶你提前探營!
※ODM直銷成市場主流 渠道能否靠白盒伺服器獲新機遇?
TAG:IT168企業級 |
※設計會話聊天機器人體驗的最佳實踐
※簡單旅遊會話
※全球首台無人駕駛跨運車正式下地;思必馳會話精靈正式發布;富士康在矽谷成立人工智慧公司
※IT領袖峰會話題聚焦5G與人工智慧
※阿米爾·汗:我從不主動選擇討論社會話題的劇本|海南電影節
※孩子、教育、健康……這些社會話題不只是電影里的故事
※《韓國語》教材:基礎生活會話-討論日程
※阿米爾·汗:我從不主動選擇討論社會話題的劇本 海南電影節
※智能會話界面的興起
※澳洲永居移民申請可能會增加英語會話測試
※獨家觀察|從青春勵志劇到社會話題劇,校園教育命題的創作升級之路
※思必馳推出啟發式對話系統,關注知識傳播的會話精靈
※在部署會話式人工智慧時要考慮的六個問題
※偷走開會話筒線的人
※韓國人為什麼總是能把社會話題片拍得這麼精彩?
※《夜伴歌聲》明日全國公映 關注社會話題恐怖片內涵再升華
※AI會話能力超越人類!CoQA挑戰賽微軟創新紀錄
※兵眼看兩會:心隨盛會話擔當
※研究提出基於圖神經網路的會話序列推薦模型
※每日乾貨:聊天約會話術