氖星智能彭軍輝：消費者需要什麼樣的機器人大腦

科技 09-14

機器人可以算得上是一個先進而又古老的辭彙，科幻小說中的種種展示著人們對它的完美預期。但機器人發展幾十載，業界至今對它還沒有明確的定位。小諦機器人科技有限公司CEO彭軍輝深耕機器人大腦多年，對於他來說足夠「聰明」的機器人才能稱得上是機器人。消費者需要什麼樣的機器人大腦，也是彭軍輝一直在尋找的答案。

北京小諦機器人科技有限公司是一家人工智慧初創公司，主要產品是氖星智能商業機器人新大腦，為客服機器人、商品展示介紹機器人、商用接待機器人、博物館導覽機器人提供大腦服務。公司在自然語言問答技術方面有十多年的技術積累，有自己的專有技術。公司目前已經獲得由北京創勢資本、安徽銀漢創投的早期投資。公司產品目前已經成熟，已獲得規模收入，產品得到用戶認可。

PS：機器人大講堂開闢了科技創業企業服務頻道，可免費為企業提供宣傳報道、招聘、資源對接、專家解惑等相關服務。歡迎大家加入我們的服務新頻道：84167176（微信號）

氖星智能彭軍輝

前兩年機器人行業獲得了社會各界廣泛關注，而最近幾年機器人行業似乎進入了低潮。

我認為行業進入低潮也是相對的。前兩年的蓬勃發展不過是虛火過旺。這個行業有一些關鍵性問題並沒有得到解決。

關於什麼是機器人，行業甚至沒有公認的標準。有人說人形才叫機器人，有人說會語音互動才叫機器人，有人說會自己行走才叫機器人。以至於故事機、刀削麵機都自稱機器人了。

這裡不需要討論什麼是機器人，因為大家的角度不一樣，必然理解也不一樣。讓我們先討論下消費者需要什麼樣的機器人？

1. 消費者需要什麼樣的機器人

大家都知道目前智能手機和電腦已經非常強大，已經極大地提高了我們的工作效率。那為什麼我們還需要一個機器人呢？這就要從智能手機和電腦的的短板說起。

最早我們在電腦輸入漢字需要學輸入法。有陣子流行五筆字型輸入法。我是上的電腦培訓班才學會這個輸入法的。當時我就想，既然電腦這麼強大，為什麼它不能理解人而需要人去理解它呢？

對，這就是智能手機和電腦存在的問題——它們需要人去理解它們的規則：理解它們的系統結構，記住每個功能的使用方法，學會開發語言的格式等等。

這便讓使用手機和電腦變成了有一定門檻的事情。你最起碼得識字吧？你還得有一定的智商。現在還有很多人不會使用電腦和智能手機。

如果和一個人交流，你會發現要比和一台電腦一部智能手機交流要簡單得多。如果對方足夠聰明，即便你有語言障礙，對方也會明白你含混不清的表達。如果對方足夠聰明，即使你表達了隻言片語，對方也會理解你的想法。如果對方足夠聰明，即使你一言不發，僅僅通過猜度，對方也會理解你的想法。這是為什麼呢？因為對方是智能的，是人類。

那麼能不能把人類的智能賦予機器呢？這樣即使不識字，即使半文盲或者文盲，即使老年人也可以和機器順暢交流了。

很久以來我們都期望有一個和人一樣聰明的機器。電影電視里描繪了各種機器人的樣子。他們有的是人形的有的不是，有的會說話有的不會，有的會動，有的只是一套系統沒有外形，但他們的共同特點都是——能理解人類的意圖。

能理解人類的意圖，這才是市場需要的機器人。

有人說你這個根本不可能實現。

但市場需求就是這個樣子的。能不能實現是廠商的事情。

2. 為什麼說操作系統不能解決機器人的問題

前幾年有很多廠商聲稱自己是做機器人操作系統的。有些廠商甚至在機器人操作系統上投資了很多資源。

然而，收效甚微。

機器人最核心的問題是怎麼更好地理解用戶意圖。而操作系統則並不是主要解決這個問題的。有些做機器人操作系統的廠商甚至更關注怎麼和硬體對接。

操作系統是位於用戶和硬體之間的系統，它把用戶的命令傳遞給硬體，由硬體完成再通過操作系統反饋給用戶。它包含了和用戶交互的部分，也包含了和硬體交互的部分。

和硬體交互的部分機器人和電腦手機並沒有多大差別，直接從電腦和手機的操作系統繼承和升級就可以了。

難在和用戶交互的這部分。這部分做不好，機器人和電腦手機就沒有什麼區別了。

如果還用電腦和手機操作系統的思維模式去開發機器人的操作系統，基本上不會有什麼升級和革新，做出來的不過是個電腦或手機的操作系統。

機器人需要理解用戶意圖，電腦和手機處理的是用戶命令。這兩者有什麼區別呢？

用戶命令是明確的，固定的，有限的。比如開機、關機，就是明確的。用戶命令是機器語言，是個固定的集合。

但用戶意圖則是模糊的，變化的，無限的，是用自然語言表達的。比如用戶說「吃」，是要吃什麼呢？誰吃呢？同樣表達「吃」這個想法，用戶可能說的不是這個詞而是「我」「想」「要」「給我」等等。

對用戶意圖的理解是個思辨的過程，而操作系統只能做條件反射式處理。

所以，我認為操作系統解決不了機器人的問題。消費者需要機器人大腦。

3. 什麼樣的機器人大腦才是好的機器人大腦

個人認為，機器人大腦是機器人的推理、決策、學習系統；它根據用戶意圖，經過推理和決策，指揮相關底層系統，為用戶做出合理的反饋。

它不是用戶界面UI(User Interface)系統，UI系統把用戶語音或者文字信號輸出給機器人大腦；大腦通過推理和決策，做出恰當地處理。UI系統是用戶界面，只是條件反射式反饋信息。

機器人大腦的主要功能也不是硬體驅動。

用戶界面和驅動系統是操作系統的兩大組成部分。而機器人大腦和這兩個東西則是完全獨立的。

機器人大腦主要的作用是準確理解用戶意圖。它處理的對象是用戶意圖，處理的主要媒介是人類自然語言。另外，它的處理媒介也可以是手勢、表情、語音之外的其他聲音信號、旗語、手語、交通信號等等。

它對用戶意圖的處理是個思辨的過程，是推理和決策的過程，不像操作系統對用戶輸入的處理是條件反射。你跟機器人說一句話，機器人要去思考你的意圖是什麼。它要考慮：你說的是不是個省略句，你是不是說錯了，你說的話和上下文有什麼關聯等等。

而操作系統對用戶的處理則要簡單得多。你在計算機鍵盤按「1」，屏幕就顯示「1」。

操作系統要解決什麼問題基本上是由它的軟體決定的。不管系統自帶軟體還是第三方開發的應用，都是寫死的程序。

而機器人大腦能解決什麼問題取決於它的能力和知識。如果想讓機器人具備某項功能只要為它增加相關知識就行，根本不需要開發新程序。而增加知識的過程可以通過一個網頁上的表單去完成（這個就是機器人學習知識的過程）。這裡說的能力，包含兩個層次：一個是因為機器人學會了某條知識而增加的能力，另一個是機器人對人類自然語言的理解能力。顯然後一種能力是機器人的核心能力。知識是用人類自然語言表達的，機器人先要有理解語言的能力才能學習知識。

機器人學會了糖尿病相關知識，它就成了一個糖尿病方面的專家；機器人學會了電商方面的知識，它就成了一個導購員或者一個客服；機器人學會了銷售方面知識，它就成了個推銷員。

這個和人類是類似的。一個小孩子6歲的孩子顯然已經有了強大的語言能力了；但他只有通過學習掌握某方面知識才能具備某方面能力。比如學習計算知識，具備了計算能力；學習繪畫知識，具備了繪畫能力；學習音樂，具備了音樂能力。

這樣，我們發現機器人最核心的能力其實是對人類自然語言處理的能力。

一些傳統做自然語言處理的公司習慣了用搜索技術做問答。但問答和搜索是完全不同的。機器人大腦需要的是問答技術，而不是搜索技術。

搜索技術的核心是關鍵字相關性查詢。只要關鍵字有相同的，搜索都會列出來。

但問答技術的核心是語義相似性計算。問答技術要計算句式和用詞，處理上下文和對話話題，處理一個問題的多種問法，計算可能存在的輸入錯誤和同音字，以及處理其他和語義相關的問題。

搜索技術雖然也可以用在機器人大腦上，但搜索的處理太粗糙。他們不處理虛詞、不處理句式、不處理多音字、不處理上下文、不處理可能存在輸入錯誤，以至於會造成大量語義信息丟失。用搜索技術做問答有的廠商正確率只能做到20%，而大多數廠商平均做不到65%。

我們經過十多年的不斷努力，不斷升級完善自然語言問答技術，目前正確率平均是大於82%的。我們處理一個問題的多種問法，處理句子之間的細微差別（這種差別可能來自於虛詞、句式等），處理句子里可能存在的錯誤，處理上下文等等。我們對語義的理解就是個思辨的過程。

從操作系統到機器人大腦的轉變不僅僅是條件反射到思辨的轉變，而且是系統結構的轉變。操作系統結構是菜單式的，樹狀的；而機器人大腦的系統結構是平行的。

你在手機上執行一個應用的某個功能，你要找到這個應用的ICON點擊打開它，找到功能再執行。要執行別的應用你要先退出當前應用，找到一個新應用打開它才行。而自然語言交互沒法去展示菜單和界面，所以如果系統結構是樹狀的，用戶無法直觀理解每個功能在「功能樹」的哪個位置，也就沒法使用「功能樹」。在實際的產品里，廠商為每個功能定義了打開命令，這樣就實際上就形成了一個命令菜單。這樣做的問題在於，命令不是自然語言，不利於記憶；命令太多增加記憶成本；命令可能產生衝突。比如說「停」是停止放音樂了還是停止前進後退呢？如果機器人正在前進同時還在放音樂，該怎麼執行呢？有的廠商甚至把機器人的功能和命令印刷成了菜單，這樣就不是機器人了。

我們機器人大腦的系統結構是平行的，也不存在命令菜單。用戶不用記憶命令，用戶按照自己的習慣表達就行。你可以說「放音樂」「我想聽音樂」「聽劉德華的歌」「放個歌」「放忘情水」等進入放音樂功能。你可以說「朝前走」「前進」「後退」「朝左轉」進入運動控制功能。我們對平行結構的要求是想進入就進入、想退出就退出、不想進入不進入、不想退出不退出。這樣機器人對用戶意圖的反饋才是穩定、可控的。

機器人的演算法和系統結構問題處理了，我們發現內容才是最大短板。我們經過反覆探索終於找到了一種方法，它可以把網頁變成機器人的知識。於是整個互聯網都成了機器人的知識庫。