當前位置:
首頁 > 最新 > 在智能家居大門口,谷歌、亞馬遜、微軟和蘋果「大打出手」了

在智能家居大門口,谷歌、亞馬遜、微軟和蘋果「大打出手」了

GIF/2K

12月20號刊

封面故事

對著谷歌 Home智能音箱,「偷偷」告訴它你想買買買的東西。英語、法語、西班牙語、印度語……語言沒有阻礙你的手機會瞬間知曉這個「秘密」,並且還能顯示搜索結果。

當然,除了懂得多國語言,谷歌 Home的語音配對(Voice Match)功能,可以讓最多六個用戶連接到同一台音箱。據說它是首個具備此功能的智能音箱,也因此顯得與其它智能音箱更加不同。

現在,語音助手已然成為智能手機們的標配,有「個性」就成為差異化的要素。比如蘋果的Siri是個段子手、三星的Bixby成了消除孤獨寂寞冷的高手……

去年10月推出的谷歌 Pixel手機在今年升級後會展現什麼樣的個性呢?這可能要取決於 「谷歌 Assistant」的發揮。

這個工具能夠整合日曆和事件功能,可以根據用戶當前的位置、活動項目整合服務,而不再是單一的網路搜索功能。「在不同設備之間通用的谷歌 Assistant,通過機器學習,會隨著時間的推移而變得越發強大。」谷歌 Assistant 工程總監Pravir Gupta說。

這是谷歌正在探索的軟體硬體結合的模式。人工智慧等技術都在背後加快著計算機的「聽說」功能。比如深度神經網路技術提高了語音搜索中語音識別的準確性,這使得用戶在嘈雜的環境中也可以與手機自由對話。在機器學習的幫助下,自然語言處理系統能夠更好地理解人們想說的話。

現在谷歌語音搜索支持 119 種語言,其中包括 11 種印度語言和 3 種印度尼西亞語言。Pixel Buds是一種能實時將你周圍別人說的話翻譯成你的母語的耳機,運用了語音識別和翻譯技術。有了它你就能在陌生的語言環境中漫遊,幾秒鐘後便能翻譯成你的母語。這項技術的翻譯效果也將隨著時間的推移得到顯著的提升。

另一方面,機器學習正在實現文本向語音轉換,通過轉換引擎,手機可以用語料並不豐富的語種,比如孟加拉語、高棉語和爪哇語與人們對話。機器學習模型有助於減少構建文本到語音模型所需的數據量。

人工智慧等技術也反過來被應用到最新一代的Pixel手機中。機器學習和計算攝影技術的結合使新款Pixel 手機具備了人像模式功能。這個功能能夠在拍攝人像時柔和虛化背景,讓Pixel在拍照功能上能夠和IPHONE 7 Plus之後的手機媲美。

語音的新戰場

好的醫療文檔有助於醫療團隊成員更好的照顧病患。現在醫生們經常要在工作日中花6~11小時在電子病歷上,醫生們嘗試使用工具來創建醫患對話的日誌。而語音技術在「翻譯」醫患對話上找到了新的戰場。

谷歌 Brain團隊嘗試使用谷歌 Assistant、谷歌 Home以及谷歌 Translate來紀錄醫患對話,並總結記錄。在「醫療對話中的語音識別」項目中,這個團隊展示了使用自動語音識別模型紀錄醫療對話的可能。大部分現有的醫療自動語音識別解決方案,主要是識別醫生醫囑,也就是說識別一個人的專用醫療術語。而這個項目是建立能夠識別多人對話,並且內容涵蓋從天氣到醫療判斷的語音模型。

谷歌的這個團隊與斯坦福大學的醫生和研究者一起開展工作。實際上,斯坦福大學已經在使用技術提升醫生滿意度上做了廣泛研究,理解類似自動語音識別技術如何抓取醫生的記錄。

在一項研究中,團隊研究了何種類型的醫療相關信息能夠被從醫療對話中抽取出來,從而降低醫生不斷打開電子病例的頻率。這項研究獲得了病人的授權,並且為了保護個人隱私而模糊了病患身份。谷歌團隊希望這項研究不僅能降低醫生的日常工作負載,還能幫助病患得到更好的醫療照顧。

掘金大部隊

除了谷歌之外,微軟、亞馬遜等公司都是語音識別市場上的主要玩家。為推動AI語音技術發展、同時阻擊蘋果和谷歌等競爭對手,微軟和亞馬遜還選擇「抱團」策略,雙方在9月就AI語音助手合作達成了共識,將雙方各自的智能語音助理Cortana和Alexa進行整合。

通過此次合作,雙方的語音助手將能夠互相激活。亞馬遜Alexa的用戶可以訪問微軟Cortana的一些特有功能,如工作日曆,閱讀工作郵件。而Cortana的用戶可以通過Alexa在亞馬遜網站上購物,也可以控制家中的智能設備。不過,評論認為有一個現實壁壘擺在微軟和亞馬遜面前,這兩家公司都沒有自己的智能手機。

微軟旗下的智能語音助手Cortana與亞馬遜旗下的Alexa、谷歌旗下的谷歌 assistant和蘋果旗下的Siri正在智能家居領域鋪開全面競爭,這幾家IT巨頭都在試圖將旗下的智能語音服務滲透到人們生活的各個場景中爭奪入口。

三星除了自有的Bixbay外,還奉行開放策略。三星電子旗下音箱和汽車零部件企業哈曼國際公司所推出的音箱分別支持谷歌Assistant、亞馬遜 Alexa 以及微軟 Cortana。哈曼旗下擁有JBL等多個知名品牌。語音操控系統與硬體的結合,成為巨頭公司圈地之戰。

不過,作為人類延長器官而存在的智能手機決定了這才是語音識別技術的最大戰場。一項調查顯示,語音識別市場在2023年將價值183億美元,年複合增長率將達到19.8%。

作者 正月

雜誌編輯董莉

微信編輯 李昊原

原文發表於《IT經理世界》,轉載請註明


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 IT經理世界 的精彩文章:

吃肯德基用帶錢嗎?帶著「臉」就夠了
積累了幾十年的臨床數據寶藏,正承載著醫藥巨頭的大數據野心
今天就談數字化,數字化企業轉型的正確打開方式

TAG:IT經理世界 |