當前位置:
首頁 > 最新 > 人人都能「小度小度」

人人都能「小度小度」

未來|展望前沿新技術

5700 字 / 15 分鐘

本文首發於航通社,原創文章未經授權請勿轉載。航通社(ID:lifeissohappy)微博@lishuhang

在第二屆百度AI 開發者大會上,一切似乎都在傳達這樣的印象:陸奇走後,百度在AI方面的進展一切如常。

外界對於「阿波龍」無人車量產,以及AI晶元的推出更感興趣,這使得李彥宏講話中提及的另一點——「Everyone can AI」(人人都能AI)似乎被忽略了。

「Everyone can AI」既意味著讓更多人用上AI相關的成果,也意味著讓普通人都能學會一些開發技能,定製自己的AI產品。

AI向大眾的普及,也是商湯、阿里、騰訊、微軟、谷歌等幾乎每個AI公司都想做的。是什麼讓百度覺得自己有信心做得最好呢?

李彥宏提到了一顆運算能力更強的晶元,一位援藏醫生,和一位小學生開發者。但是,他講得相對沒那麼多的DuerOS,其實才是實現「Everyone can AI」的「關鍵先生」。

1 |人人用AI:「貼牌」加鋪貨

DuerOS經常被拿來和Siri、Cortana(小娜)、Alexa等語音助手並排比較,但百度官方堅持將其定義為一款「操作系統」。

百度智能生活事業群組(SLG)總經理景鯤說:「操作系統核心三要素是什麼?第一是交互的變革;第二是全新的應用生態;第三率先打通商業模式的閉環。」

如果你搜索「操作系統核心要素」,只會找到「內核、系統程序、編譯環境、API」這樣的辭彙。但百度如上的定義,至少說明「應用生態」和「商業模式」成為對DuerOS的首要考量。

截至2018年6月的官方數據顯示,DuerOS合作夥伴超過200家,硬體落地產品超過110款,智能設備激活數突破9000萬台,月活躍設備數超過2500萬台,在商業模式的探索方面可謂相當進取。

DuerOS 生態版圖。圖/百度

不僅是一些規模較小的智能硬體廠商,連曾經的「網紅」Vinci頭機和汪峰代言的FIIL耳機,也都投入了DuerOS的懷抱。

在這些設備製造商因為種種原因,要減緩甚至停止自己開發AI引擎和交互的腳步時,DuerOS充當了拯救者的角色。

然而,DuerOS的合作夥伴中,還有一些正在自己開發AI產品,或有自己的AI助手品牌。那麼,他們與百度AI的合作,是否會跟他們的自研產品衝突呢?

小米生態鏈旗下的米兔插卡智能故事機就是一例。該機器跟孩子互動的時候,使用的技術就來自DuerOS。

小米也曾與微軟簽署協議,在銷往海外市場的小米智能音響中,植入Cortana(小娜)而不是「小愛同學」。不過,在面向國內的產品中並沒有這麼做。

小米在招股書中說,他們用硬體銷售來推動自己互聯網服務的落地,那麼理應在每一台設備上都啟用他們的「小愛同學」才對。

但雷軍早在2017年11月就和陸奇「同框」公布了小米物聯網產品和百度AI的合作,主要內容是將來自DuerOS的一些先進的演算法和能力應用到小米全線的AI產品中。

根據36kr的報道,「DuerOS可讓小米電視、小米手機甚至掃地機器人,更加智能,聽得懂用戶的發號施令」。

(https://36kr.com/p/5105367.html)

這並不意味著小米放棄對自家「小愛同學」的研發,而是將自身不一定擅長,或者自研性價比較低的部分開放出去,直接採用百度已經準備好的技術,並不妨礙小米向硬體用戶銷售增值服務。

同時,百度還找到OPPO、vivo和華為,在vivo X21、NEX、華為P20、P20 Pro、OPPO Find X等多款旗艦機型中植入DuerOS。

這些手機廠商其實有各自的語音助手服務品牌。vivo的語音助手叫Jovi,在央視的世界盃廣告當中也沒少搶鏡。華為的助手叫Hi Assistant,OPPO就叫「小歐」。它們的界面和喚醒詞也各不相同。

但是,這些助手的問答、對話技能,都少不了手機晶元提供商高通的幫助。據資料顯示,高通為使用驍龍系列處理器的手機提供了人工智慧引擎AI Engine,而高通和百度基於DuerOS共同發展了終端側的關鍵詞檢測和自然語言處理技術,為雲端服務提供補充。

(http://www.c114.com.cn/news/1761/a1045934.html)

這就使得DuerOS最擅長的自然語言處理技術,得以出現在小米、華為、OV這些手機品牌上。這樣的合作,與Alexa、Cortana、Google Assistant和第三方廠家的合作是有區別的。

百度允許廠商使用除了自己「小度小度」之外的喚醒詞和自有的品牌,DuerOS方面則是輸出底層技術,為廠家「貼牌」做語音助手,這種相對靈活的合作方式更受到廠家的歡迎。

然而,歸根結底,百度還是希望通過一些自家產品和非「貼牌」產品,直接打出DuerOS和「小度」的品牌,以對外界起到標杆和示範作用,正如Surface系列產品線給微軟帶來的巨大收益一樣。

百度現在重點扶持「小度在家」音箱和「小度智能音箱」,堅定走低價普及的路線,與天貓精靈、小米小愛音箱等展開一場混戰。

小度在家音箱。圖/航通社

即使在混戰中,百度的產品仍然在性價比上有著相當的優勢,歷次放貨均秒速「售罄」。

航通社曾在《「小度在家」是「AI智能音箱」,但視頻通話才是它的最大亮點》中提到,小度在家的前兩代產品售價分別為2999元和1699元。在第二代音箱上市一年後,成本基本沒降的小度在家音箱售價定為599元,百度從中提供了大量的補貼。

有自媒體透露,百度這一輪智能音箱的補貼預算約為5000萬元至1億元,而小度在家單款產品就有希望衝擊100萬台銷量。在百度、阿里、小米集體「甩貨」的情況下,其餘幾十家銷量少於10萬台的智能音箱廠家「基本上要涼了」。

(https://www.huxiu.com/article/237772.html)

目前為止,低價策略是成功的:只要有越來越多的終端,都能採用「小度小度」作為喚醒詞,這就越發有利於幫助用戶形成一個穩定的品牌印象。

2 |人人開發AI:「搭積木」型開發者

「95後的黎英明同學,他綜合利用多種AI技術打造無人政務機,也完成了自己從實習生到產品總監的蛻變;中科院在讀的研究生任家強同學,他利用百度的AI技術開發用於污染場地的風險管理模型;還有梁佳同學的盲人導航系統、王志勇和羅鵬同學的智能船艙溫控系統、李連偉、趙岳、童謠同學的自動駕駛輪椅……」

李彥宏在講話當中特意點出了一些非常年輕的AI開發者。不過,值得注意的是,他們使用的是包括語言識別能力、計算機視覺能力、自然語言理解能力、用戶畫像能力在內的整個「百度大腦」的能力,因此這些少年英豪們相對來說「段位」都已經比較高了。

實際上,關於圖像識別、自動駕駛等高階功能,相關的程序編寫及演算法訓練過程,在看不懂的人看來是如同天書一般的。僅僅依靠這些較高階的能力,是無法做到在開發方面「Everyone can AI」的目標的。

一個TensorFlow開發場景。圖/Flickr

流行的Python、C等語言語法和自然語言相去甚遠,基本告別了可視化界面,涉及機器學習的還必須掌握TensorFlow等框架。即使谷歌、商湯等公司都推出了所謂「零基礎」甚至給中學生的編程課本,但前AI時代的大人們,完全掌握的是另一套思維模式,只能舉白旗投降。

相比之下,去製作一個基於對話和語音識別的機器人交互場景,就不用管那麼多了,能看懂、會動手做的人也一下子多了很多。

最簡單的做法是,你把問題和答案編成一列一列的列表,以指定格式輸入到相關源代碼當中,這在上古時期的「小i機器人」時候就能做。

我想做一個自己的語音助手。圖/航通社

至於DuerOS和微軟的Bot Framework等新平台,之所以說加入了「智能」成分,就是說逐步消除了過往系統必須逐字定義和比對的弊端。

本次發布的DuerOS3.0在自然對話交互方面繼續升級,將一次喚醒、多次交互的「極客模式」向全體用戶推送,以免每次開口都要不自然的加上「小度小度」的前綴。

DuerOS3.0在多輪智能糾錯,遞進意圖識別、有條件的意圖識別,以及利用擴展特徵理解用戶行為等方面都有進展。在糾錯方面,像「胡冰清是誰?國務卿的親」這樣的請求,都可以輸出正確的結果,免去了編輯問答對時的後顧之憂。

合併同類問題可以給我省下很多時間和精力。圖/航通社

語音助手的後台技術不斷升級,但開發者們輸入問答對、接入API和打包應用程序的過程,沒有太大的改變,甚至越來越輕鬆,像搭積木一般。

這樣的一問一答,能催生出多少想像力的火花?

在百度的一段演示視頻中,有小孩對著沒有屏幕的小度智能音箱在玩「我當宰相」——這是一款MUD文字遊戲,大概20年前的網民想必會非常耳熟。

(https://dueros.baidu.com/dbp/botcup/index)

《我當宰相》遊戲。圖/百度

小度:「鄰國首領送您珍貴禮物,您是否接受?」

孩子:「接受!」

小度:「您接受了該禮物,並上交了一部分給國庫,民眾覺得您很廉潔。」

這樣的複雜對話應用程序,都是在不需要為用戶的變種輸入、口誤、記憶錯誤等發愁的前提下,使用可視化界面協助編輯出來的。

航通社找到了一位開發者,在官方論壇中貼出了一個應用「釣魚島萬事通」。據說它能「回答用戶釣魚島歸屬問題,並以歷史證明釣魚島從古至今都是中國領土」。

(https://developer.baidu.com/forum/topic/show/247307)

「意圖」的編輯。圖/百度開發者論壇

指向同一個目的的一系列查詢詞變種,被稱為一個「意圖」,如果一個「意圖」包含了系統不太能理解的問法,可以通過補充自定義「詞典」來完善。

通過百度雲提供的存儲空間,和系統提供的默認函數模板稍微修改,「照葫蘆畫瓢」地就可以實現基本的問答邏輯功能了。該「釣魚島萬事通」的調試結果如下:

調試窗口。圖/百度開發者論壇

正是依靠如此簡單易懂的開發流程,百度允許任何人向自己的DuerOS開發板輸入任何類型的新知識來訓練它,然後再將這些開發好的程序提交上來,擇優錄取到「小度在家」等產品當中,推送給所有用戶。

2017年11月至今,DuerOS技能開發平台上線技能500多個,控制的物聯網設備數量達6000萬台,彙集了超過16000名開發者。截止目前,累計有 24935 人次參加了百度開發者中心組織的線下沙龍、交流會、工作坊等活動。

(https://developer.baidu.com/activity/index)

這就是DuerOS最為倚重的草根開發者群體。

在百度開發者社區當中,可以看到很多人網購一塊樹莓派板子和一塊DuerOS開發板,加上一個充電寶,幾根數據線連在一起,開始了他們的開發者生涯。

「開發日誌」。圖/百度開發者論壇

這讓航通社想起2014年前後,在深圳的眾多「創客空間」內,火花的閃耀和3D印表機的嗡鳴。儘管智能硬體的熱潮已經遠去,同樣的場景卻在全國各地重獲新生。

在論壇里一些資深開發者曬出自己的「開發日誌」,手把手的教人們去怎樣做,等於建立了關於DuerOS的「百度知道」。

百度在北京、深圳等地舉辦普通人也能聽懂的開發者沙龍和工作坊,並舉辦「2018對話式AI技能大賽」,提供總值100萬元的獎勵。

對話式應用程序被DuerOS和亞馬遜的Alexa音箱同樣稱為「技能」(Skills)。通過「技能商店」累積開發者生態,從而擴展可用性,贏得市場的手段,也是從Alexa真正開始的。

2018年3月,Alexa技能數量超過30000個,已經初步具備了成為語音界App Store的潛能。而在沒有Alexa的中國,主流的語音交互平台都尚未完成對技能商店的搭建工作。

(https://voicebot.ai/2018/03/22/amazon-alexa-skill-count-surpasses-30000-u-s/)

面對這樣的局面,百度加緊籠絡「草根開發者」們,爭取成為國內開發者生態做得最好的廠商。

3 |奪回失去的入口

DuerOS為手機、家電等硬體廠商提供了「交鑰匙」式的解決方案。與初期眾多廠商採用的訊飛方案相比,DuerOS主攻交互體驗的提升,讓對話更像是發生在真人之間。

在招募開發者方面,DuerOS儘力降低門檻,用可視化編輯器簡化開發過程。百度還宣布半年內不抽成,開發者可全額獲得「技能」收入。

至於這些「技能」的應用範圍也更廣,除了推送給直接使用DuerOS的音箱、汽車和智能硬體,也可以應用於後端使用DuerOS技術的小米、OV、華為等語音助手,以增強它們的自然語言交互能力。

DuerOS並非只適用於百度自家產品,而且在與第三方合作過程中,不必在意對方是否屬於「阿里系」、「騰訊系」或「雷軍系」等。

在交互能力的改進、開發者的招募、平台商業化的推進三方面,DuerOS多管齊下。

無人汽車、機器學習等高端AI應用,撐起了百度AI研發的高度和門面;同時,DuerOS為代表的自然語言交互,也在積極尋找AI最貼近實際,最容易商業化的用途。

李彥宏的講話帶動百度和金龍汽車的股價直衝漲停。但長遠來看,DuerOS如果能成功推開,它對百度股價的貢獻可能會更大。

Alexa給亞馬遜股價帶來的提升,正是在於人們認為語音會是下一代人機交互的入口,取代PC搜索引擎和手機應用商店的地位。

(http://36kr.com/p/5062132.html)

如果資本市場對百度的未來想像,只是希望它作為自動駕駛領域的「扛把子」,那也無可厚非;但是,如果百度可以把握住信息流之後的下一個互聯網入口,這顯然就要好太多了。

作為第一代入口——PC搜索引擎的代表,又錯過了第二代入口——移動互聯網的時代,這樣的百度最需要的,就是再一次抓住互聯網入口,把握下一個時代的主動權。

關於智能音箱們,你需要了解……


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 航通社 的精彩文章:

知乎世界盃「洗腦廣告」,瞄準了一群怎樣的新用戶

TAG:航通社 |