當前位置:
首頁 > 科技 > 用語音喚醒萬物,中國兩大互聯網巨頭同步亮出AI黑魔法

用語音喚醒萬物,中國兩大互聯網巨頭同步亮出AI黑魔法

人機交互是人工智慧技術的基本,交互模式有圖像識別、手勢識別和語音識別等。而在人類進化過程中,語言不僅起著非常重要的作用,也承載著非常豐富的信息,這令智能語音在交互方式方面具備得天獨厚的優勢。語音識別技術的迭代演進讓智能語音市場前景無限。很多產品場景下,深度學習已與晶元緊密結合,如遠場喚醒、打斷,包括離線識別,都已在晶元級技術層面實現。

用語音喚醒萬物,中國兩大互聯網巨頭同步亮出AI黑魔法

面對智能語音交互,兩大互聯網巨頭這回同時出手了

7月5日早10點,百度AI開發者大會在北京國家會議中心開始。百度度秘事業部總經理景鯤宣布百度DuerOS開放平台發布,並介紹了語音交互在AI領域的戰略方向以及相關技術和解決方案等問題。而僅僅相隔4小時後,阿里人工智慧實驗室也召開了2017夏季新品發布會,發布與智能語音相關的消費級產品天貓精靈。

在DuerOS開放平台發布會上,景鯤從衣兜里接連掏出三款DuerOS開發套件和一款硬體參考設計(據說他還想帶更多晶元,但是口袋實在放不下了)。

1、搭載樹莓派,利用科勝訊技術的個人版。即刻申請就可以搭載一個個人可以對話的語音設備;

2、輕量版。把一元錢大小的晶元放在任何一個設備裡面,設備就可以對話;

3、標準版。兩麥、四麥、六麥、八麥的標準版都可以即可申請;

4、完整一體化的參考設計。如開放電路板設計、開放結構設計、開放麥克風陣列等等。手機、電視、冰箱等任何設備,都可以搭載DuerOS,變成一個能」聽懂」的設備。

用語音喚醒萬物,中國兩大互聯網巨頭同步亮出AI黑魔法

景鯤說,開發者使用這些開發套件,只要接一個電源,接一個麥克風,就可以讓身邊的家電說話。通過打造AI時代的安卓——DuerOS,讓每個人,無論你是大公司還是小公司,甚至普通開發者,都能夠以低門檻打造屬於自己的智能語音交互設備。

同樣是語音AI領域,不同於DuerOS開放設備平台,阿里巴巴選擇推出公司首款智能音箱產品—天貓精靈,看上去更類似於中國版的Echo。天貓精靈的負責人淺雪指出,這不只是具有語音識別和理解能力的智能音箱,其音箱中搭載的人工智慧Ali Genie系統是產品的核心所在,代表著產品具備NLP支持的理解力、執行力和基於數據的進化能力。AliGenie使用了FPGA雲端硬體定製化邏輯電路加速,演算法上載入了混合神經網路。

與百度相仿,AliGenie也發布了開發者平台,面向不同類型的開發需求。在發布會中,功能演示與產品介紹交替進行,演示內容涉及聽音樂、網購、找手機、定時器、充話費、連接智能家電等功能,能看出阿里以語音與金融結合想要達成產品捆綁與消費方式變革的目標。

語音交互核心三要素:聽清、聽懂、滿足

景鯤表示,DuerOS是人工智慧時代的安卓系統,DuerOS希望成為一個開放賦能的生態系統。」有什麼核心的要素需要滿足,才能推動時代變革?我們總結出核心三要素:聽清、聽懂、滿足。很多廠商可以做到聽清,但是做不好聽懂和滿足,只有把這三個都做好,才能滿足。」

用語音喚醒萬物,中國兩大互聯網巨頭同步亮出AI黑魔法

「聽清」:百度的語音識別率做到了近場識別的準確率97%以上,但這些在AI時代還不夠。在AI時代,技術要與場景相結合。百度希望把語音放到真正的場景裡面去解決問題,研發了麥克風陣列、回聲消除、語音喚醒、人像識別等技術。

「聽懂」:數據多、介入深是打造對話系統的必然條件,具備這兩點才能做好一個真正可以對話的」聽懂」系統。百度是具備數據量最大的公司,擁有億級的多輪對話數據、十億級的知識圖譜數據。

「滿足」:滿足」聽一首某某的歌」這樣的用戶需求還不夠,真正用戶想要的是更自然、更複雜的需求,比如」我要聽我手一杯品嘗你的美這首歌」,比如」想聽哥哥的歌」,只有把用戶在真實場景中表達的複雜請求做好,才能真正做出一個真正聽懂用戶需求的產品。

他認為在這個時代,只有百度在中國市場是唯一具備聽清、聽懂、滿足的實力。在現場,景鯤還演示了百度語音系統多輪交互的能力,現場演示了一台HTC手機利用DuerOS的多輪交互過程,這種交互只有百度的技術才能驅動。通過連續發問:「找一找本地人氣最火爆的家常菜」、「雍和宮附近有嗎」、「第二家有什麼推薦菜」、「有wifi嗎」、「好停車嗎」……多輪連續展開的對話。他說,「聽懂」的目標,就是要FreeStyle,讓用戶最自然地跟設備進行交互。

現場,景鯤宣布百度將全資收購人工智慧公司Kitt.AI,把KITT.AI的語音能力和自然語言處理能力融入到百度平台中,全面免費向百度的合作夥伴賦能開放。KITT.AI聯合創始人、CTO陳果果先生現在演示了如何使用KITT.AI語音喚醒技術快速打造一個語音喚醒設備。根據陳果果先生演示,進入Snowboy的喚起詞庫並新建喚起詞「你好景鯤」後,接著只需要說三遍「你好景鯤」,即可完成喚起詞的訓練。在測試環節,設備只會對喚起詞「你好景鯤」進行響應。

來自度秘的百度工程師羅興演示了「如何將百度DuerOS的能力接入搭載Alexa的Anker音箱」。羅興通過十七行代碼,用1分鐘的時間,讓原本只會英文的音箱馬上變得能聽懂中國話。

揭秘百度DuerOS背後的聲學設計英雄

科勝訊(Conexant)CX20924四麥克風和CX20921雙麥克風語音輸入處理解決方案,是百度DuerOS平台開發套件和參考設計的幕後英雄。科勝訊公司總裁Saleel Awsare在接受本刊採訪時表示,遠距離語音識別和控制需要克服大量的聲學挑戰,這涉及回聲消除、背景雜訊、混響, 麥克風和揚聲器的選擇和放置等許多因素,而AudioSmart語音輸入處理器、CODEC以及軟體實現智能設備的遠距離語言識別和語音控制功能則是克服上述挑戰的利器。

用語音喚醒萬物,中國兩大互聯網巨頭同步亮出AI黑魔法

百度DuerOS開發套件

科勝訊AudioSmart語音輸入處理器(用於四麥克風應用的CX20924,以及用於雙麥克風應用的CX20921)是百度所宣布的開發套件之中的核心組件,其關鍵優勢在於:

? 只需兩個或四個麥克風實現穩定的遠場聲音交互

? 獨家的智能音源定位Smart Source Locator技術可以用於音源定位(僅限四麥克風配置)

? 加強版雜訊抑制Smart Source Pickup – 對環境噪音的處理性更好,針對非定頻音源,比如電視,以及非指令使用者的音源,可以智能地予以過濾,使得引擎識別率更高

? 通過全雙工回聲消除技術(AEC)實現語音打斷功能,即使設備在大聲播放音樂或者做語音播報的時候,也能夠準確識別喚醒詞

遠場(far-field)語音技術可為用戶帶來真正解放雙手的體驗。AudioSmart語音打斷功能,用戶無需動手則可自由控制設備。當設備的音頻系統處於空閑狀態時,只需要簡單地說出觸發詞即可控制設備,即便音頻系統處於播放狀態,也能達到同樣的效果。據稱,該遠場功能可實現對設備實現五米遠的無縫語音控制,即使在嘈雜的真實世界中,也能將語音命令從背景噪音中過濾出來。此外,360度語音收音功能,能在大多數家庭和辦公環境下提供精準的語音識別。

用語音喚醒萬物,中國兩大互聯網巨頭同步亮出AI黑魔法

百度DuerOS智能音箱參考設計

作為語音識別技術的先鋒,科勝訊的AudioSmart技術在亞馬遜Echo及其Alexa語音服務(AVS)的推動之下,已快速成為各類智能家庭與IoT裝置最令人驚艷的用戶交互介面。在與亞馬遜合作於去年十二月推出支持AVS的2-Mic開發套件之後,科勝訊成為亞馬遜AVS開發工具包的第一供貨商。不同於其他方案, AudioSmart只需要2個麥克風就可以實現與現在使用5-8個麥克風的其他產品有相同或更好的性能,更不用說最新推出的全新4-mic AVS開發套件。

除了百度DuerOS和亞馬遜 Alexa外,其頂級客戶還包括微軟、騰訊、SK Telecom、韓國電信Korean Telecom、Naver等,從而為家電、機器人、家用影音設備(如機頂盒、喇叭、音響等)、家庭網路裝置、安全設備、玩具、以及語音虛擬助理等提供語音交互功能。

科勝訊業務成長的另一個重要增長點來自耳機市場。目前,科勝訊正隨著耳機製造商向新一代的USB-C標準技術遷移,其最新的CODEC解決方案是專為協助耳機製造商在此新興領域取得競爭優勢而設計,能讓耳機現在可自帶電源並能接受數字音頻信號,還可通過電纜直接與源設備進行數據交換,從而給繁榮的耳機市場進行更偉大的創新提供了無限可能。

支持原創,版權所有

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 國際電子商情 的精彩文章:

攫取121億美元暴利!二季度地球上最賺錢公司實至名歸!
iPhone8或推動3D曲面屏爆發,國產玻璃熱彎機的機會已來?
IC Insights VS Yole 未來5年CIS銷售預測大相徑庭
DP Type-C介面出貨兇猛,三星S8一項特性完爆華為P10
博通轉單新蕾、全科、文曄,渠道調整不影響穩定供貨

TAG:國際電子商情 |

您可能感興趣

美國鎮國神器「民兵」III型洲際導彈,是出自中國人之手!
中國遊客出手闊綽 法媒:歐洲要用這些小細節吸引「財神」
中國互聯網BAT三巨頭,誰最牛?——上篇
美媒:BAT將會被取代?中國下一代技術巨頭正在崛起
歐洲鋪開紅毯歡迎中國遊客 法媒:除了WIFI熱水也很重要
中國這款新型戰機橫空出世,美國五代機獨佔市場夢想或將破滅
中國或成AI領域第一大國 日媒報道中國AI發展三優勢
中國互聯網電視本周精彩推薦
美媒:中國有望對德出售尖端技術,噴氣機時代高級玩家呼之欲出
「中國下一代的科技巨頭是TMD!」
中國下一代技術巨頭正在崛起,BAT將被這三家公司取代?
網傳中國將橫空出世一款戰機 中國海軍或迎來「咆哮時代」
全球第一家拒絕中國IP訪問的比特幣交易網站,竟是中國的交易平台!
為什麼泰國吸引的中國遊客比越南多?中國網民:泰國文化衝擊大!
中國5架大型無人偵察機高調同框出現!世界第二空軍成形
中國3D列印技術世界頂尖 全球唯一掌握鈦合金激光成型並裝機應用
韓國速食麵對外出口再創歷史新高 中國是韓國速食麵第一出口大國
重磅!中國十大油氣技術新鮮出爐!
IT影響中國:微鯨電視榮獲用戶喜愛品牌獎
美媒:忘了BAT吧,中國下一代的科技巨頭是TMD!