氖星智能彭軍輝:消費者需要什麼樣的機器人大腦
機器人可以算得上是一個先進而又古老的辭彙,科幻小說中的種種展示著人們對它的完美預期。但機器人發展幾十載,業界至今對它還沒有明確的定位。小諦機器人科技有限公司CEO彭軍輝深耕機器人大腦多年,對於他來說足夠「聰明」的機器人才能稱得上是機器人。消費者需要什麼樣的機器人大腦,也是彭軍輝一直在尋找的答案。
北京小諦機器人科技有限公司是一家人工智慧初創公司,主要產品是氖星智能商業機器人新大腦,為客服機器人、商品展示介紹機器人、商用接待機器人、博物館導覽機器人提供大腦服務。公司在自然語言問答技術方面有十多年的技術積累,有自己的專有技術。公司目前已經獲得由北京創勢資本、安徽銀漢創投的早期投資。公司產品目前已經成熟,已獲得規模收入,產品得到用戶認可。
PS:機器人大講堂開闢了科技創業企業服務頻道,可免費為企業提供宣傳報道、招聘、資源對接、專家解惑等相關服務。歡迎大家加入我們的服務新頻道:84167176(微信號)
氖星智能 彭軍輝
前兩年機器人行業獲得了社會各界廣泛關注,而最近幾年機器人行業似乎進入了低潮。
我認為行業進入低潮也是相對的。前兩年的蓬勃發展不過是虛火過旺。這個行業有一些關鍵性問題並沒有得到解決。
關於什麼是機器人,行業甚至沒有公認的標準。有人說人形才叫機器人,有人說會語音互動才叫機器人,有人說會自己行走才叫機器人。以至於故事機、刀削麵機都自稱機器人了。
這裡不需要討論什麼是機器人,因為大家的角度不一樣,必然理解也不一樣。讓我們先討論下消費者需要什麼樣的機器人?
1. 消費者需要什麼樣的機器人
大家都知道目前智能手機和電腦已經非常強大,已經極大地提高了我們的工作效率。那為什麼我們還需要一個機器人呢?這就要從智能手機和電腦的的短板說起。
最早我們在電腦輸入漢字需要學輸入法。有陣子流行五筆字型輸入法。我是上的電腦培訓班才學會這個輸入法的。當時我就想,既然電腦這麼強大,為什麼它不能理解人而需要人去理解它呢?
對,這就是智能手機和電腦存在的問題——它們需要人去理解它們的規則:理解它們的系統結構,記住每個功能的使用方法,學會開發語言的格式等等。
這便讓使用手機和電腦變成了有一定門檻的事情。你最起碼得識字吧?你還得有一定的智商。現在還有很多人不會使用電腦和智能手機。
如果和一個人交流,你會發現要比和一台電腦一部智能手機交流要簡單得多。如果對方足夠聰明,即便你有語言障礙,對方也會明白你含混不清的表達。如果對方足夠聰明,即使你表達了隻言片語,對方也會理解你的想法。如果對方足夠聰明,即使你一言不發,僅僅通過猜度,對方也會理解你的想法。這是為什麼呢?因為對方是智能的,是人類。
那麼能不能把人類的智能賦予機器呢?這樣即使不識字,即使半文盲或者文盲,即使老年人也可以和機器順暢交流了。
很久以來我們都期望有一個和人一樣聰明的機器。電影電視里描繪了各種機器人的樣子。他們有的是人形的有的不是,有的會說話有的不會,有的會動,有的只是一套系統沒有外形,但他們的共同特點都是——能理解人類的意圖。
能理解人類的意圖,這才是市場需要的機器人。
有人說你這個根本不可能實現。
但市場需求就是這個樣子的。能不能實現是廠商的事情。
2. 為什麼說操作系統不能解決機器人的問題
前幾年有很多廠商聲稱自己是做機器人操作系統的。有些廠商甚至在機器人操作系統上投資了很多資源。
然而,收效甚微。
機器人最核心的問題是怎麼更好地理解用戶意圖。而操作系統則並不是主要解決這個問題的。有些做機器人操作系統的廠商甚至更關注怎麼和硬體對接。
操作系統是位於用戶和硬體之間的系統,它把用戶的命令傳遞給硬體,由硬體完成再通過操作系統反饋給用戶。它包含了和用戶交互的部分,也包含了和硬體交互的部分。
和硬體交互的部分機器人和電腦手機並沒有多大差別,直接從電腦和手機的操作系統繼承和升級就可以了。
難在和用戶交互的這部分。這部分做不好,機器人和電腦手機就沒有什麼區別了。
如果還用電腦和手機操作系統的思維模式去開發機器人的操作系統,基本上不會有什麼升級和革新,做出來的不過是個電腦或手機的操作系統。
機器人需要理解用戶意圖,電腦和手機處理的是用戶命令。這兩者有什麼區別呢?
用戶命令是明確的,固定的,有限的。比如開機、關機,就是明確的。用戶命令是機器語言,是個固定的集合。
但用戶意圖則是模糊的,變化的,無限的,是用自然語言表達的。比如用戶說「吃」,是要吃什麼呢?誰吃呢?同樣表達「吃」這個想法,用戶可能說的不是這個詞而是「我」「想」「要」「給我」等等。
對用戶意圖的理解是個思辨的過程,而操作系統只能做條件反射式處理。
所以,我認為操作系統解決不了機器人的問題。消費者需要機器人大腦。
3. 什麼樣的機器人大腦才是好的機器人大腦
個人認為,機器人大腦是機器人的推理、決策、學習系統;它根據用戶意圖,經過推理和決策,指揮相關底層系統,為用戶做出合理的反饋。
它不是用戶界面UI(User Interface)系統,UI系統把用戶語音或者文字信號輸出給機器人大腦;大腦通過推理和決策,做出恰當地處理。UI系統是用戶界面,只是條件反射式反饋信息。
機器人大腦的主要功能也不是硬體驅動。
用戶界面和驅動系統是操作系統的兩大組成部分。而機器人大腦和這兩個東西則是完全獨立的。
機器人大腦主要的作用是準確理解用戶意圖。它處理的對象是用戶意圖,處理的主要媒介是人類自然語言。另外,它的處理媒介也可以是手勢、表情、語音之外的其他聲音信號、旗語、手語、交通信號等等。
它對用戶意圖的處理是個思辨的過程,是推理和決策的過程,不像操作系統對用戶輸入的處理是條件反射。你跟機器人說一句話,機器人要去思考你的意圖是什麼。它要考慮:你說的是不是個省略句,你是不是說錯了,你說的話和上下文有什麼關聯等等。
而操作系統對用戶的處理則要簡單得多。你在計算機鍵盤按「1」,屏幕就顯示「1」。
操作系統要解決什麼問題基本上是由它的軟體決定的。不管系統自帶軟體還是第三方開發的應用,都是寫死的程序。
而機器人大腦能解決什麼問題取決於它的能力和知識。如果想讓機器人具備某項功能只要為它增加相關知識就行,根本不需要開發新程序。而增加知識的過程可以通過一個網頁上的表單去完成(這個就是機器人學習知識的過程)。這裡說的能力,包含兩個層次:一個是因為機器人學會了某條知識而增加的能力,另一個是機器人對人類自然語言的理解能力。顯然後一種能力是機器人的核心能力。知識是用人類自然語言表達的,機器人先要有理解語言的能力才能學習知識。
機器人學會了糖尿病相關知識,它就成了一個糖尿病方面的專家;機器人學會了電商方面的知識,它就成了一個導購員或者一個客服;機器人學會了銷售方面知識,它就成了個推銷員。
這個和人類是類似的。一個小孩子6歲的孩子顯然已經有了強大的語言能力了;但他只有通過學習掌握某方面知識才能具備某方面能力。比如學習計算知識,具備了計算能力;學習繪畫知識,具備了繪畫能力;學習音樂,具備了音樂能力。
這樣,我們發現機器人最核心的能力其實是對人類自然語言處理的能力。
一些傳統做自然語言處理的公司習慣了用搜索技術做問答。但問答和搜索是完全不同的。機器人大腦需要的是問答技術,而不是搜索技術。
搜索技術的核心是關鍵字相關性查詢。只要關鍵字有相同的,搜索都會列出來。
但問答技術的核心是語義相似性計算。問答技術要計算句式和用詞,處理上下文和對話話題,處理一個問題的多種問法,計算可能存在的輸入錯誤和同音字,以及處理其他和語義相關的問題。
搜索技術雖然也可以用在機器人大腦上,但搜索的處理太粗糙。他們不處理虛詞、不處理句式、不處理多音字、不處理上下文、不處理可能存在輸入錯誤,以至於會造成大量語義信息丟失。用搜索技術做問答有的廠商正確率只能做到20%,而大多數廠商平均做不到65%。
我們經過十多年的不斷努力,不斷升級完善自然語言問答技術,目前正確率平均是大於82%的。我們處理一個問題的多種問法,處理句子之間的細微差別(這種差別可能來自於虛詞、句式等),處理句子里可能存在的錯誤,處理上下文等等。我們對語義的理解就是個思辨的過程。
從操作系統到機器人大腦的轉變不僅僅是條件反射到思辨的轉變,而且是系統結構的轉變。操作系統結構是菜單式的,樹狀的;而機器人大腦的系統結構是平行的。
你在手機上執行一個應用的某個功能,你要找到這個應用的ICON點擊打開它,找到功能再執行。要執行別的應用你要先退出當前應用,找到一個新應用打開它才行。而自然語言交互沒法去展示菜單和界面,所以如果系統結構是樹狀的,用戶無法直觀理解每個功能在「功能樹」的哪個位置,也就沒法使用「功能樹」。在實際的產品里,廠商為每個功能定義了打開命令,這樣就實際上就形成了一個命令菜單。這樣做的問題在於,命令不是自然語言,不利於記憶;命令太多增加記憶成本;命令可能產生衝突。比如說「停」是停止放音樂了還是停止前進後退呢?如果機器人正在前進同時還在放音樂,該怎麼執行呢?有的廠商甚至把機器人的功能和命令印刷成了菜單,這樣就不是機器人了。
我們機器人大腦的系統結構是平行的,也不存在命令菜單。用戶不用記憶命令,用戶按照自己的習慣表達就行。你可以說「放音樂」「我想聽音樂」「聽劉德華的歌」「放個歌」「放忘情水」等進入放音樂功能。你可以說「朝前走」「前進」「後退」「朝左轉」進入運動控制功能。我們對平行結構的要求是想進入就進入、想退出就退出、不想進入不進入、不想退出不退出。這樣機器人對用戶意圖的反饋才是穩定、可控的。
機器人的演算法和系統結構問題處理了,我們發現內容才是最大短板。我們經過反覆探索終於找到了一種方法,它可以把網頁變成機器人的知識。於是整個互聯網都成了機器人的知識庫。
目前我們的機器人大腦還在發展的早期,它擁有的知識量還十分有限。但它支持用戶自建個性化知識庫,不需要機器學習和人工標註一樣可以獲得很高的準確率。每個用戶都可以培養出來自己的個性化專業化的機器人。目前我們平台已經有1000多個機器人,他們能回答孕嬰健康、營養健康、糖尿病等等知識。
綜上所述,一個好的機器人大腦必須基本以下能力:強大的自然語言處理能力、穩定可控易操作的系統結構、完善的知識庫。
目前機器人行業,尤其是需要和人互動的服務機器人行業,機器人大腦成了行業瓶頸。
這也是我們工作的動力。我們知道我們的工作非常有價值。雖然經過了十多年的努力,依然沒有取得商業上的成功,甚至是屢屢失敗,我們依然沒有放棄最初的夢想。
誠摯招聘
機器人大講堂招!聘!啦!編輯、運營兩個全職崗位正在招人!並面向全國招聘大學生兼職寫手!有才氣,有夢想就別磨蹭!工作地點在北京遠大路附近,如有意願,請加堂博士微信號詳聊!
※Nature紀念人工智慧60周年專題:深度學習綜述
※戰車也能下水!這款國產兩棲戰車厲害skr人
TAG:機器人大講堂 |