當前位置:
首頁 > 最新 > 在阿爾發狗完勝之後,谷歌AI「偷」走了人聲

在阿爾發狗完勝之後,谷歌AI「偷」走了人聲

在上海工作的王勇(化名)近日接到一則推銷電話,「賣車險的」。他剛好不忙,於是很紳士地跟這位推銷員小姐聊了一會兒,解釋了一下自己的情況不需要車險了。末了還跟她說了聲「謝謝」。

但是這個看起來普通的電話很不尋常。

在掛掉電話後,王勇收到了一則簡訊,險些昏厥。簡訊內容如下:「你好,我是剛才給你打電話的電銷機器人小三,我們公司的聯繫電話是XXXXX,歡迎後期來電諮詢。」

時代不同了。你可能被人工智慧(AI)騙過,未來你也許也可以用AI去迷惑別人了 。有這樣一個機器人「小夥伴」,它可以代你向餐廳打電話預訂座位;還能冒充你跟熟人調侃、替你回郵件。

這一切正在發生。當地時間5月8日,谷歌I/O開發者大會在美國加利福尼亞州山景城召開。這家矽谷科技巨頭再次強調了AI先行的戰略。

在這次開發者大會上,谷歌不僅展示了功能更加強大的語音助手Google Assistant,還發布了第三代人工智慧TPU(張量處理器)晶元,它的前輩就是「阿爾法狗」在圍棋界所向披靡的「秘密武器」。由此,谷歌一方面與人工智慧晶元巨頭英偉達的GPU(圖形處理器)形成競爭,另一方面也意在挑戰微軟和亞馬遜雲。

一句「嗯哼」脫口而出

谷歌CEO桑達爾·皮查伊在會上演示了事先錄好的兩段語音對話,分別是語音助手代替人類預約理髮和預訂餐廳的。

比起傳統的對話語音機器人,使用谷歌Duplex AI語音系統的新助手要人性化得多,它不僅能夠和人類進行多回合的對話,而且還自帶語氣詞,聽起來相當逼真。

在第一段女聲版機器人顧客和理髮店店員的對話中,機器人顧客的一句「嗯哼」以假亂真,與人類使用英語對話的語氣十分相似,而且機器人也不再局限於僅僅以「是」或者「不是」簡單地回答提問,而是會與人類進行談判和商量,最終達成了一致,完成預約工作。

在另一段男生版的機器人顧客和中餐店服務員的對話中,機器人不僅能夠聽懂帶口音和不規範的英語,而且還會在對話中進行即興發揮,讓雙方的交互變得更加「優雅」而自然。比如當餐廳服務員告訴顧客當時「不用等位」時,機器人顧客人性化地追問道:「那麼一般情況下,等位需要多久?」

皮查伊沒有透露這項服務何時能夠讓用戶使用,不過表示從今年夏天起就將進行公測。

值得注意的是,在《愛樂之城》中客串樂手的美國著名歌手約翰·傳奇(John Legend)的聲音也將被谷歌助手採用。包括他在內,谷歌目前已經擁有六種不同的人聲。

皮查伊在大會上表示:「谷歌的語音合成系統Wavenet的模型,是基於原始的音頻來創造出更加接近人類、更加自然的聲音,包括音高、語速以及停頓等。」

這項技術如果普及,或許意味著未來商家接起顧客的電話時,將很難分辨究竟是真人還是機器人在向自己諮詢提問。

中國的人工智慧企業出門問問創始人兼CEO、谷歌前工程師李志飛對第一財經記者表示:「這種場景雖然有點聳人聽聞,但是與谷歌的競爭對手如以網路書店起家的亞馬遜相比,谷歌在最底層的核心技術以及把技術打磨、做細做精方面絕對是『一騎絕塵』的,這主要受到公司的工程師文化以及強大的研發隊伍的影響。」

晶元雲端齊發力

谷歌的策略已經從「人工智慧優先」(AI First)全面轉向「獨有人工智慧」(AI Only)。除了語音功能以外,谷歌郵箱Gmail也加入了智能化功能,運用機器學習可以在人們輸入時實時推薦可能會使用到的短語。該功能被稱作「智能創作」(Smart Compose),本月底將會正式上線。

而人工智慧在谷歌地圖方面的應用就更加強大了,利用全新的Google Lens的應用,地圖和相機直接實現打通,與谷歌街景結合,打通虛擬和現實世界,類似於增強現實(AR)的功能,由現實到虛擬,只要打開相機,就能給你指方向。此外,人工智慧還能直接與衛星圖像結合,把更多商戶和新地址添加到地圖中。

「這才是我們真正需要的人工智慧。」興民智通(002355.SZ)首席運營官張人傑對第一財經記者表示,「一些國內公司扎堆兒在做同質化的東西。有時候,產品設計的初心在某種程度上決定了結果。」該公司的主業之一是智能網聯汽車數據的採集運營。

強大的人工智慧背後是高性能晶元的支持。I/O大會上,谷歌還發布了最新一代的人工智慧晶元TPU 3.0版本。兩年前谷歌首次宣布推出通用的人工智慧晶元時,就意在與英偉達的人工智慧晶元GPU競爭。

據介紹,新一代TPU能夠幫助谷歌提升包括錄音音頻中的語言識別功能,還能在視頻和照片中辨別出物體,並從文字當中提取隱藏的表情。

谷歌已發布兩個版本的TPU處理器,公司將允許使用谷歌公有雲服務的第三方開發者在TPU上進行開發,從而在雲服務業務方面與微軟和亞馬遜競爭。本周稍早時,微軟也發布了基於微軟雲Azure特殊晶元的早期應用。

皮查伊表示,最新一代的TPU處理器的性能比去年發布的第二代版本要強8倍,可提供超過100萬億次浮點運算。而且谷歌第一次引入液體冷卻的方法來解決散熱問題。

「把自用的TPU開放出來做雲服務,顯示了谷歌在雲業務方面加大投資布局。谷歌將與所有提供智能雲服務的廠商競爭;而晶元方面則將和英偉達展開競爭。」研究機構Gartner研究副總裁盛陵海對第一財經記者表示。

下一個風口:醫療+AI

國內的智能語音領軍企業科大訊飛(002230.SZ)也在密切關注谷歌I/O大會的新動向。

科大訊飛執行總裁胡郁對第一財經記者感嘆道:「谷歌的語音技術一直挺牛的。」據介紹,一小時的語音數據如果在傳統處理器上進行智能應用處理,需要一萬小時才能完成,因此科大訊飛一直在跟蹤人工智慧專用晶元的前沿進展。

胡郁向第一財經透露,科大訊飛看好智能語音在醫療方面的應用。「我們正在和國內的幾個醫院談,用我們先進的智能語音技術幫助醫生記錄下手術的全過程。」 通常醫生在做完手術之後,要通過回憶把手術過程記錄下來留存。胡郁說:「我們讓醫生在手術過程中戴上耳麥,能實時把他們的指令記錄下來,手術完畢後直接匯總成文,為醫生減輕了大量整理工作。」

人工智慧和醫療的結合將是科技公司下一個爭奪的主戰場。在印度,谷歌的醫療AI已經在幫助醫生進行視網膜篩查糖尿病和心臟病的工作,以解決醫療資源分配不公的問題。

「兩年前,谷歌開發了一套神經網路,它能通過眼部醫學造影來探測糖尿病視網膜病變。今年,人工智慧團隊利用深度學習模型,已經能夠高度精確地預測一位病人未來心臟病和腦溢血的發病風險。」谷歌5月9日在發給第一財經記者的聲明中表示。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 第一財經 的精彩文章:

李明博涉嫌受賄遭到起訴 DAS公司有關人士曾作偽證
奇點汽車曲線獲得生產資質,完成30億C輪融資

TAG:第一財經 |