你對智能音箱說的悄悄話,也有可能被其他人聽到噢!
在家中百無聊賴找不到人聊天時,跟智能產品里語音助手尬聊,應該是很多人都有過的經歷。不過一些用戶對智能音箱說的悄悄話,也有可能被人類聽到。
最近彭博社消息顯示,亞馬遜在全球僱傭了數千名員工,他們會聽到某些來自 Echo 智能音箱的用戶語音請求,並負責將這些轉錄的語音進行注釋標記,以提高 Alexa 對人類語言的識別功能。
這些員工分布在波士頓、哥斯大黎加、印度、羅馬尼亞等地,有亞馬遜員工也有外包人員。其中有羅馬尼亞布加勒斯特的工作人員表示,他們每天需要工作 9 個小時,每一次輪班都需要為超過 1000 個音頻進行解釋標記。
還有一個在波士頓的語音標記員表示,他曾經為特定的詞語,比如泰勒斯威夫特(Taylor Swift)積累了語音數據,並將這些語音請求指向音樂藝人。
對此,亞馬遜的回應是,這是會涉及很小一部分 Alexa 的錄音,目的是為了改善用戶使用智能語音助手的用戶體驗。這些錄音都會被嚴格加密,員工在標記語音的過程中,並不會知道這些錄音的具體來源。
亞馬遜在隱私政策中並沒有明確提示,有人會收聽 Alexa 所收集的語音,而是使用了另外一種表述「我們使用你對 Alexa 的請求來訓練我們的語音識別系統」。不過用戶可以在隱私設置中,選擇禁止設備向亞馬遜提供錄音以開發新功能。
就目前而言,就算各類宣傳把語音助手、智能音箱們吹噓得功能強大,它們依然只是很初級的人工智慧,最常用的功能還是唱歌、尬聊、問天氣。
語音助手要想「掌握」一門語言,需要解決兩個問題:聲音識別和聲音合成。其中聲音識別是向機器輸入信息,又分為兩步,分別是:
- 第一步,將語音轉成文字的語音識別;
- 第二步,語義理解,這裡就需要用到自然語言處理技術
密歇根大學的學者 Florian Schaub 認為,人們也許並不會留意到,自己跟語音助手說的小秘密可能會被其他人聽到,而覺得這些設備都在進行神奇的機器學習。事實上,現階段的這些技術依然需要人工的參與。
市場分析公司 Canalys 的數據顯示,截止到去年全球共賣出 7800 部智能語音助手設備,另外還有數以千萬計的人與智能手機內置的語音助手對話。
去年 9 月曾有人對比了蘋果、Google、亞馬遜這三家的語音助手,其中一個發現就是,它們在識別美式口音、印度口音的英語時表現不錯,然而在識別中式口音的英語時,蘋果的 Siri 和亞馬遜的 Alexa 的準確率則大幅下降。
總的來說,要讓機器能夠聽懂人類語言,並且做出準確「聰明」的回應,依然需要大量人工介入。如果想要把語音助手當做樹洞,也要注意保護自己的隱私信息啦。
題圖來源:The Online Tech
※設計 Google 總部的建築事務所,這次要打造一座漂浮城市
※Apple Music 美國付費用戶數量超過 Spotify
TAG:愛范兒 |