當前位置:
首頁 > 最新 > Duer OS 3.0 是「新一代」的操作系統?還差那麼一點

Duer OS 3.0 是「新一代」的操作系統?還差那麼一點

去年的7月5日,國家會議中心,陸奇在首屆百度AI開發者大會上喊出了「All in AI」的口號,並正式開放了Duer OS和Apollo兩個平台。一年後,同樣的地點,李彥宏重新回到台前,大聲宣告「Everyone Can AI」,並展示了各個業務線上的成果。

技術落地與產業合作,成為了百度開發者大會的主軸,作為國內綜合技術儲備更強的人工智慧公司,百度在這次的AI競賽中獲取了優勢,現在還努力的嘗試技術落地,將這種優勢變現。無論是Appollo與百度大腦在B端的落地,還是計算機視覺與語音語義技術在C端的普及運用。

此次百度AI開發者大會的亮點的確非常的多,比如L4級別的無人駕駛車阿波龍的量產,首款雲端全功能AI晶元崑崙的誕生,全棧技術布局的百度AI大腦3.0升級,面向量產更加開放的Apollo解決方案的發布,智能小程序的推出,還公布了百度用AI技術對傳統行業的種種改造案例。

相較於上面的種種成果,去年重磅發布的Duer OS今年顯得存在感稀薄,因為除了「打通商業模式閉環」啟動商業分成這一點外,並沒有吸引到媒體的關注。

但實際上,Duer OS 3.0不僅帶來了核心技術方面升級,還提供超過20多個跨場景、跨設備的解決方案,同時為合作夥伴打造平等賦能的生態環境並努力構建商業模式的閉環。就如同官方所說,Duer OS 3.0是「新一代的操作系統」。

渡鴉輸掉了戰役,但Duer OS沒有輸掉戰爭

不久前的6月11日,在百度科技園內,百度正式發布了「首款自有品牌智能音響」——小度智能音箱。嘗鮮價僅為89元。這個價格,遠低於之前智能音箱 Raven H。

去年11月的百度世界大會上,定價為1699元的智能音箱Raven H發布,百度給渡鴉科技一小時的出場時間,亮相十分高調,但是產品問津者寥寥,試生產5-10萬台的音響,最終只生產不到一萬台。

渡鴉音響徹底涼了,而無論是天貓精靈、小米小愛還是騰訊聽聽,都在用的是思必馳的解決方案。渡鴉輸掉了戰役,但是Duer OS並沒有輸掉戰爭。因為除了智能音箱外,Duer OS還和美的、海爾、聯想、VIVO、TCL等眾多領域的知名企業達成合作,將DuerOS的對話能力應用到了多場景。

截止 2018 年 6 月,Duer OS智能設備激活量已經超過 9000 萬,月活躍設備超過 2500 萬。Duer OS平台生態持續擴大,合作夥伴數量已經超過 200 家,搭載 Duer OS落地的主控設備超過 110 多款,在 DuerOS 平台上的開發者群體已經超過 16000 人,這三個數據均為國內第一。

在更親民的小度的上市與劃時代操作系統的加持下。相信百度在智能音箱的領域,定能再次殺回一片天。

劃時代的自然對話交互

劃時代的自然對話交互是兩方面的,一個是核心技術的提升,另一個是跨場景跨設備的解決方案。

在核心能力的部分,Duer OS 3.0帶來了情感語音播報、聲紋識別、智能引導與糾錯、視覺搜索能力、視頻理解能力等自然語言交互技術的全面升級。WaveNet+拼接讓小度播報的流暢度和自然大幅度提升,聲紋識別為用戶提供個性化的交互體驗,系統增加了為孩子設計的兒童模式以及支持連續對話無需重複喚醒的極客模式,另外增添了視覺搜索能力與視頻理解能力。

最讓現場觀眾驚嘆的是兒童模式與視頻理解能力。在主辦方的演示中,兒童模式不光聲音、內容與交流方式不同,而且在播放視頻的時候還能智能跳過不適合少兒觀看的鏡頭。而視頻理解能力支持實體識別、場景識別、動作識別與視頻生成,在演示中,可以實現視頻中的台詞甚至劇情的搜索跳轉。

在場景與解決方案的部分,Duer OS 3.0提供包括有屏設備解決方案、藍牙設備解決方案和行業解決方案等在內超過20個跨場景、跨設備的解決方案。

有屏設備解決方案不只是增加了一塊屏幕,實際上很多機器對人的輸出最高效的實現形式其實是圖文視頻,比如導航線路的規劃,如果語音播報,可能需要花費一分鐘以上。

Duer OS的有屏設備解決方案,是一個以語音交互為中心、軟硬一體化的全鏈條解決方案。通過一塊只有名片大小的模組方案,合作夥伴的屏幕設備就可以被打造成一個可以對話的有屏設備。同時,DuerOS還聯合洛可可,為合作夥伴提供不同場景、完整的有屏設備參考設計。

百度還與高通等機構合作,推出藍牙設備解決方案,低門檻低成本,面向更多中小廠商開放,可以讓藍牙設備生產廠商輕鬆獲得智能語音能力,將藍牙終端變成智能終端。

Duer OS行業解決方案,已逐步覆蓋酒店和養老場所等場景。以洲際酒店為例,賓客可以通過語音控制客房智能家居控制、設鬧鐘、查信息、獲取酒店應用服務等。

此外,Duer OS還提供安卓APP的語音交互解決方案,通過音語義一體化、場景註冊等技術,實現場景自適應,降低安卓開發者進入AI行業的准入門檻。如在麻將類遊戲中,通過吃、碰等語音進行操作。

對話式內容服務生態

AI時代,用戶獲取內容與服務的門檻越來越低,Duer OS技能開放平台支持以自然交互為主、多設備、多形態的技能開發,以需求為中心,打造直達用戶、張口即得的用戶體驗,並為開發者打造健康、開放、共贏的生態。

Duer OS3.0提供包含基礎工具、有屏技能工具和付費技能開發等全面的技能開發工具;推廣方面,以技能商店、小度在家home card與query推廣作為分發入口,精準推廣來自開發者的優質技能。

作為國內首個支持帶屏技能開發的開放平台,Duer OS技能開放平台/小度技能開放平台已彙集超過16000名開發者,上線技能超過500個,技能類型數量超過15種,成為國內最具活力的技能開放平台。

用戶只需說出「我想唱歌」,搭載Duer OS的設備就可以打開「唱吧」, 用戶說一句「我想學英語」,在線少兒英語平台VIPKID就會打開。隨時隨地,不需要像在其他設備上打開特定的APP。

打通商業閉環

Duer OS 3.0有兩種變現形式,一種是技能內付費,另一種是付費技能,相當於內購制與買斷制。開發者可以自行選擇。會上Duer也宣布了與凱叔講故事和Discovery的合作。

而普通開發者在Duer OS平台打造一款可收益技能,僅需4步,創建一個技能;在配置項中選擇付費模式;選擇付費技能或技能內付費中配置好價格;開始進行技能開發,在設備端測試後發布。截至今年年底,百度會將技能收入100%回饋開發者,鼓勵開發者打造更優質的技能。

為了更好的鼓勵開發,Duer OS還提供了對話技能大賽以及億元開發者支持計劃,提供開發資金傳播資源,雲伺服器教育成長以及流量支持孵化基金等形式的支持。

觀察:商業閉環與屏幕共享仍需努力

未來圖靈認為Duer OS 3.0的確可以稱得上是新一代操作系統,但是在兩個方面仍然需要努力。

第一個方面是商業閉環的部分,用戶付費的實現的形式是掃描屏幕的二維碼支付,而不是聲紋支付。官方解釋說,這是為了避免操作失誤。但這個理由的確很牽強,因為如果聲紋技術足夠好的話,這個問題是不存在的。更何況,官方也承認,想利用戶的「衝動消費」,明明可以「一句話的事」,卻要讓用戶拿起手機掃二維碼,那種衝動又不知道要冷卻多少。

商業閉環的第二點,就是是否有足夠的動力讓用戶內購。官方的宣傳片中,用戶在一個聽歌曲猜歌名的遊戲中購買了道具。手機上的遊戲、小程序的內購,有一個重要的因素就是社交分享系統,可以購買道具刷分然後炫耀。但是智能音箱卻不存在社交的要素。如果是一般用戶的話,在聽歌曲猜歌名的時候遇到問題,拿起手機後,想到的應該是用手機上的聽音識曲軟體去識別,而不是去付錢。缺少了社交的要素,很多的內購其實是不存在的。

商業閉環的第三點,就是場景不佳的問題,在官方的宣傳片中,家長和孩子要看Discovery,告訴帶屏幕的智能音箱,購買後兩個人圍著智能音箱去看,這其實是很魔幻的一件場景。如果能夠實現屏幕共享,完全可以在手機上或是OTT大屏上去看,畢竟靠在沙發上看大屏,比彎腰盯著智能音箱的小且解析度不高的屏幕要舒服的多。

第二個方面就是剛才提到的屏幕共享。實際上屏幕共享是去年穀歌就提到的一項技術。用戶可以將Google Home的任何信息投射到自家電視上或者手機上以及一切和谷歌相連接的智能終端上面。

優質的內容可以投屏到電視或使用手機獲取,另外一些日常的工具,屏幕共享也有很大的用處,以導航為例,當我們對智能音箱說導航時,我們的確想知道具體的路線,但是如果這條信息顯示在手機上,或者是智能汽車上,會更加的方便。

未來圖靈希望這個功能能夠實現,如果年底的百度世界大會來不及加上的話,明年的Duer OS 4.0怎麼也得有吧。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 未來圖靈 的精彩文章:

2020全球5G商轉:重塑全產業,創造萬億大商機
AI百人 | 凌感科技何安莉 費越:新交互 除了動口還能動手

TAG:未來圖靈 |