當前位置:
首頁 > 新聞 > 語音識別錯誤太多?高科技巨頭們偏偏「不信邪」

語音識別錯誤太多?高科技巨頭們偏偏「不信邪」

語音識別錯誤太多?高科技巨頭們偏偏「不信邪」



撰文:Jing Cao、Dina Bass

要讓我們能夠自然地與智能設備進行對話,語音識別技術還必須大幅改進


有一位用戶在亞馬遜的網站上寫道:「我對她又愛又恨」

語音識別錯誤太多?高科技巨頭們偏偏「不信邪」


亞馬遜公司(Amazon)的Echo讓每個家庭都擁有一個人工智慧助手的承諾不再空洞。擁有這款語音激活式設備(因為是女性聲音,被俗稱為Alexa)的用戶很容易為「她」的魅力所折服:Alexa能夠打優步(Uber)專車、訂購比薩餅、檢查10年級孩子的數學作業,不一而足。亞馬遜公司稱,每天有超過5000人對Alexa示愛。


與此同時,Alexa的擁躉們也都知道的一點是:你需要極為緩慢清晰地說出自己的指令,否則她的答覆很可能是「抱歉,我無法回答這個問題。」有一位用戶在亞馬遜的網站上寫道:「我對她又愛又恨。」但這位用戶仍然給了Alexa五星好評。「你很快就會學會以她能夠理解的方式向她說話,就像是與一個讓人無可奈何的懵懂小孩對話一樣。」


過去幾年裡,語音識別技術取得了長足進步。但這些進步仍不足以讓這項技術在人類的日常生活中普及開來,進而開啟人機互動的新時代,讓我們與汽車、洗衣機、電視機等各類設備展開語音溝通。儘管語音識別技術取得了種種進步,但多數人仍習慣於滑動、輕敲、點擊等手勢操作。在可預見的未來,這種現狀恐怕難以改變。


攔路虎


那麼攔路虎究竟是什麼呢?首先,在一定程度上,支撐語音識別技術的人工智慧仍有改進空間。此外,數據的嚴重匱乏也是一大問題,具體而言就是人類語音音頻數據的匱乏。人們通常會在程序往往無法辨識的嘈雜環境中以不同語言、不同口音和不同方言說話,而在這方面的數據積累還遠遠不夠。

因此,亞馬遜、蘋果公司(Apple)、微軟公司(Microsoft)和中國的百度都已經開始在世界範圍內廣泛收集海量的人類語音數據。微軟在全球許多城市設立了模擬公寓,以錄製志願者在家居環境中的對話內容。亞馬遜每小時都會將Alexa收到的海量語音詢問記錄上傳到一個龐大的資料庫中。百度也在中國各地收集方言數據。然後它們會利用這些數據教電腦如何解析、理解及響應不同的語音指令和語音詢問。

語音識別錯誤太多?高科技巨頭們偏偏「不信邪」



語音助理對比


真正的挑戰在於如何設法獲取現實世界中自然狀態下的真實對話記錄。百度旗下位於加利福尼亞州森尼韋爾市的人工智慧實驗室負責人亞當?科茨(Adam Coates)稱,即使95%的精確度也不夠。

「我們的目標是將錯誤率降低到1%。」他說,「只有達到那樣的水平,人們才會真正相信機器能夠理解我們的話。那將改變一切。」


不久以前,語音識別技術還非常原始。2006年,在面向滿滿一禮堂的分析師和投資者進行的演示中,微軟在Windows上運行的早期版本語音識別技術甚至將「媽媽」(Mom)聽成了「阿姨」(Aunt)。而5年前蘋果公司的Siri首次亮相時,這款個人助理的出錯也備受嘲諷,因為它經常給出不正確的答案或是聽不清問題。在被問及吉莉恩?安德森(Gillian Anderson)是不是英國人時,Siri竟然給出了一份英國餐館的列表。微軟現在表示,該公司的語音引擎準確率已經堪比甚至超越專業速錄員。Siri贏得了人們的勉強認可,Alexa更是讓我們窺見了未來的誘人前景。

語音識別錯誤太多?高科技巨頭們偏偏「不信邪」


神經網路技術


這種進步在很大程度上歸功於神經網路技術(一種大體基於人腦式架構的人工智慧)的發展。神經網路無需明確的程序指令便可自學各種內容,但通常需要具有豐富廣度而多元性的數據支撐。語音識別引擎處理的數據越多,就越善於理解不同的語音,也就更接近在眾多語言和情景中實現自然對話的最終目標。


因此,各大科技巨頭在全球各地爭相採集海量語音數據。「我們系統獲得的數據越多,表現就越好。」百度首席科學家吳恩達(Andrew Ng)說,「也正因如此,語音識別是一項資本密集型業務。沒有多少組織擁有這麼多的數據。」


收集數據


高科技行業從上世紀90年代開始重視語音識別技術,當時微軟等公司依靠的都是來自Linguistics Data Consortium等研究機構提供的公共數據。總部位於賓夕法尼亞大學(University of Pennsylvania)的Linguistics Data Consortium是一家語音和文本資料庫機構,在美國政府的支持下於1992年成立。後來,科技公司開始自行收集語音數據,其中一些是志願者上門朗讀各種內容的錄音。如今,隨著語音控制軟體的普及度逐步提高,科技公司也通過自己的產品和服務收集大量數據。

語音識別錯誤太多?高科技巨頭們偏偏「不信邪」



當你讓自己的手機搜索信息、播放歌曲或導航路徑時,你的聲音有可能正被某家公司錄製下來。(蘋果、谷歌、微軟和亞馬遜均強調,它們會將用戶數據進行匿名化處理,以保護客戶隱私。)當你向Alexa詢問天氣和最近的橄欖球賽比分時,智能設備便會利用你說話的內容改進其理解自然語言的能力(儘管在你呼喚Alexa的名字之前,「她」不會傾聽你的對話。)「從設計角度看,你使用得越多,Alexa就會變得越聰明。」Alexa資深首席科學家尼科?斯特羅姆(Nikko Strom)說。


其中的一項關鍵挑戰是讓語音識別技術熟悉不同的語言、口音和方言。也許這一點在中國最為重要。為了收集中國各地的方言數據,百度在2016年春節期間啟動了一項營銷計劃,推出方言保護計劃。該公司向用戶承諾,如果他們為該計劃做出貢獻,今後便可使用自己的方言與百度展開互動。短短兩周內,該公司就錄製了超過1000小時的方言語音數據。很多人完全免費提供這些數據,因為他們都對自己的方言感到自豪。該計劃讓一位四川中學教師激動萬分——他讓全班同學用四川話錄製了1000多首古詩。


另一項挑戰是讓語音識別技術在嘈雜的環境(比如酒吧和體育場等喧鬧的環境)中識別語音指令。微軟也在Xbox上預裝了一款名為Voice Studio的應用,專門收集人們在玩遊戲或看電影時的對話信息。為了吸引用戶貢獻自己在玩遊戲過程中的對話內容,該公司為參與用戶提供了各種各樣的獎勵,包括點卡和遊戲角色的數字裝扮。該項目在巴西大獲成功,微軟在當地的分公司還在Xbox主頁上著重推廣了這款應用。他們隨後利用這些數據開發了巴西葡萄牙語版的Cortana語音助手,並於2016年早些時候發布。


科技公司還在為特定的場景設計語音識別系統。例如,微軟一直在測試一項機場語音識別技術,可以在不受持續的機場航班廣播干擾的情況下回答旅行者的問題。該公司的語音識別技術還被用於麥當勞(McDonald)汽車穿梭餐廳的自動點餐系統。這套系統可以忽略嘈雜的汽車音響、孩子們的尖叫聲和各種各樣的口頭感嘆詞,成功從中提取出複雜的指令,甚至連調味品也不會錯過。亞馬遜也正在汽車上展開測試,希望Alexa能克服道路上的各種噪音,在車窗開著的情況下也表現良好。

語音識別錯誤太多?高科技巨頭們偏偏「不信邪」 點擊播放 GIF/900K



蘋果Siri技術展示


儘管各大企業在全球爭相收集數據,它們也都在想辦法用較少的數據實現更好的語音識別效果。在微軟從事了20多年語音識別技術開發工作的首席語音科學家黃學東稱,正在麥當勞測試的語音識別技術比那些數據使用多很多的系統還要精確。「雖然數據使用量不是最大的,仍然可以實現技術突破。」


谷歌大體信奉「少即是多」的理念,它採用了一種零敲碎打的方法——利用難以辨別的聲音單元來構建文字和短語。藉助其語音識別系統,谷歌希望通過一項改變來解決各種不同的問題。谷歌拼接了數以萬計的、時長通常僅有2至5秒的語音片段,以形成數據集。該公司研究員弗朗索瓦?博費(Fran?oise Beaufays)稱,這一過程所需的計算資源更少,更容易測試和調整。百度也在開發更加高效的演算法。根據其演算法,語音識別系統只需學習一種語言便可簡化另外12種語言的學習難度。百度首席科學家吳恩達稱,在學習只有數萬人而非數百萬人掌握的小語種時,這種演算法顯得尤為重要——因為很難針對這樣的語言收集到龐大規模的數據。


但被問及何時才能通過自然語言與數字助理順暢交流時,就連吳恩達這樣的科學家也顯得有些愁眉苦臉。沒有人知道確切答案。即便對這一領域最高水平的科學家而言,神經網路技術仍然有很多謎團有待解開。有很多工作只能通過不斷試錯來改進;沒有人能確定某項技術調整可能產生什麼樣的後果。根據現有的技術和方法,摸索過程很可能要耗費數年時間。吳恩達、黃學冬和博費等科學家都表示,人們永遠無法得知何時能實現突破,讓Alexa和Siri像真正的人類那樣對話。


編輯:李辰旭稼、劉馨蔚


翻譯:徐子軒



立即獲得關於TA的更多信息!


送書福利丨特朗普的世界觀丨實體書店丨沃爾瑪犯罪丨


粉絲造星丨許小年丨Hello World丨紅色電話亭丨離奇謀殺案丨


......


韓國檢方就「干政門」再發逮捕令


韓國最差的日子還在後頭 |視頻


盡在《商業周刊/中文版》App


請您繼續閱讀更多來自 商業周刊/中文版 的精彩文章:

中國遊客大受歡迎,美國各地爭相打出中文牌說「你好」
為了實現2020年旅遊消費7萬億元的「小目標」,你們還不玩起來?
揭秘「避稅大使」蘋果140億美元稅務風波,一場冤案還是另有隱情?
500萬廣告費敵不過」刷單的藝術「?虛擬評價讓阿里巴巴苦不堪言
想挑戰澳門和拉斯維加斯?日本的博彩業還有很長的路要走

TAG:商業周刊/中文版 |

您可能感興趣

太保濕反而不太好!保養皮膚易犯「3大錯誤」越弄越糟
寶寶偏頭會影響大腦發育?千萬不要用錯誤方法矯正新生兒偏頭情況
犯錯誤會撒嬌是一件很不錯的技能!
慢比錯好!這些錯誤的理財觀念不要有
為什麼補鈣卻不能預防骨質疏鬆?可別犯這三個錯誤
洋蔥這樣吃不抗癌反而易致癌,很多人沒意識到這個錯誤
不是原則性的錯誤,何鬚髮脾氣呢
化妝大師解密導致你皮膚變差的真正原因,不要再犯這些錯誤了
穿氣墊鞋跑步不易受傷?不要被錯誤「常識」所誤導
練太極拳常見的主要錯誤有那些?
你還在抬頭止鼻血?糾正那些錯誤的養生偏方!
看貓片學性技巧?要注意這幾點錯誤哦
炮哥糾錯:害人的錯誤性知識,別再信!
牙齒護理最常犯的6大錯誤,只有你還不知道!
你最不該相信的錯誤健身迷信
不要錯誤地詮釋別人的好意。
大重量卧推才有效?糾正你的錯誤觀念!
飲食錯誤是眾多疾病的源頭
為什麼你怎麼減肥還是胖 這些錯誤習慣太可怕