Google召開I/O大會,AI,全部都是AI
全文3300+字,閱讀預計耗時9分鐘
如果要讓筆者評價哪一家公司是全球AI技術最強的公司,那麼筆者會毫不猶豫地回答:Google!
從AlphaGo開始,Google的AI技術就吸引了全世界的目光,即使是微軟、Facebook這樣的互聯網巨頭其AI技術都不一定有Google那麼強悍,即使他們做到了,他們也並沒有像Google去做一個公開展示甚至是實裝到每一個用戶都能看得見、摸得著的地方。
Google的AI技術給筆者的感覺就是充滿了科幻感,他們把很多我們曾經幻想的AI應用場景非常真實地做了出來,Google在AI方面的每一個進步都能讓我們感到幾分驚艷,例如進化過的Google翻譯、進化過的Google Assistant等等。
這一次Google I/O大會上Google是直接用強悍的AI技術撐滿了全場,讓筆者感覺Google可能已經押寶AI,整個公司的戰略已經從「Mobile First」調整為了「AI First」。Google希望未來自己可以利用在AI技術上的領先吊打其他互聯網巨頭,頗有一種「我有AI我就是天下第一牛B」的感覺。
廢話不多說,我們一起來看看Google都給我們帶來了什麼樣的新東西。
Google Assistant
Google Assistant這一次是得到了全面的進化,首先是其發音。
Google旗下的DeepMind曾經開發過一個特彆強大的基於人工智慧的語音生成演算法 —— Wavenet,該演算法生成的語音在聽感上與母語是英語的人說話沒有什麼區別,甚至可能要更好。
這一次Google直接把Wavenet應用到了Google Assistant上,現在的Google Assistant擁有6種發音非常自然的新聲音,不過這些語音都只是英語語音,其他語言可能還有待進一步跟進。
值得一提的是Google CEO Pichai希望用戶和Google Assistant的交互可以更為自然,在多輪對話迭代之後,用戶甚至可以不需要「Hey Google」這個指令來啟動它,它可以自我響應用戶的指令,這是相當高級的。
不過僅僅只有這些的話,對於Google Assistant來說只是一個小升級而已。真正的進化在於,Google在Google Assistant中整合了一個名為「Google Duplex」的新技術。
在日常生活中,我們有時候需要打電話給美髮店預約時間,或者打電話給飯店預約座位,或者打電話給快餐店預定外賣。這樣的操作往往是很繁瑣的,一方面電話的交流比較低效、耗時,另一方面有一些人會心理上不太願意去打電話,在國內,互聯網巨頭給出的解決方案是美團、大眾點評這樣的產品,而在國外,由於老外們沒有這樣完全基於線上的解決方案,所以他們日常還是要面對繁瑣地打電話到各種店鋪預約這樣或是那樣的服務。
為了解決這一痛點問題,Google Assistant將利用Google Duplex技術在後台自動為你打電話去完成各種服務的預約。這意味著Google Assistant將實現和微軟小冰類似的全雙工語音,同時由於要和陌生的真人進行實際交互,Google Duplex需要讓語音足夠自然,足夠易懂。
以下是筆者從TechInsider搬運過來的一個完整的現場演示,這一演示可以說是把全場的氣氛帶到了一個高潮:
要注意的是這並不意味著Google Duplex可以通過圖靈測試,因為它是針對電話預約服務這樣的場景進行過特殊優化的,而且即使在這個場景下Google Duplex仍然會有智商不夠的表現。
不過不管怎麼說,能做到現在這個程度,已經非常非常驚艷了,最重要的是這個技術將不只是停留在PPT上,這項技術會實裝到每個用戶的Google Assistant上。將技術落實到實際,這才是最重要的。
Google Photos
實際上AI在圖像領域的應用已經是相當廣泛的了,對於我們這些普通用戶來說,我們現在已經可以通過相機實時識別物體、文字,在拍照過程中可以對場景進行實時計算進行優化。
Google Photos這一次提供了一個很強悍的功能,簡直是AI界的美圖秀秀。
GIF
Google Photos將可以對圖片進行智能的處理,例如修復過曝的圖片、動態調整圖片的色彩等等。其中最為強大的一點是,Google Photos支持給黑白照片填色,雖然這個應用在兩三年前就已經出現了,但是這一次是這項技術第一次如此大規模的應用。
Google Lens
Google Lens也做了一些功能上的更新,不過這些功能更新沒有什麼太大的亮點, 很多是國內廠商已經做過玩剩下的,例如OCR、物體識別、搜同款等等,這些功能在今天已經算不上亮點。
筆者覺得Google Lens比較有吸引力的一個功能是Google加入了一個針對文檔的特別功能,在拍照的時候Google將允許用戶直接提取照片中的文檔並轉化成PDF,從演示來看這個效果是要比掃描全能王更好、更快的,未來著可能會成為筆者提升工作效率的一大工具。
其次Google Lens的OCR雖然不是亮點,但是它在交互方式上比較新穎,用戶可以直接複製圖片上的文字,甚至可以進行快速搜索,這個交互模式能更好地提升效率。
Google News
在國外Google News可以說是相當多人必備的資訊類App,這一次Google甚至是給Google News加入了AI元素。
GIF
這是一個實時的基於人工智慧的信息篩選,它和國內應用廠商做的個性化資訊推送略有不同,它可以將相關的資訊歸類到一起,並且可以「提前」為你做好資訊的分類。
對於信息來源Google也會運用AI進行審查,用來過濾一些虛假的信息,盡全力使你看到的資訊是最真實的。
Gmail
Gmail這個功能就相當不一般了,可以說Google以一種相當喪心病狂的方式暴力地提升了用戶編輯郵件的效率。
GIF
通過Smart Compose技術,Google會自動根據你輸入的上下文、你所回復的郵件自動猜想出整個句子,代替你完成繁瑣地輸入。這個功能可以讓讓你回復郵件的效率直線提升。
不過很遺憾這個技術目前也應該只支持英文,筆者希望國內例如騰訊這樣的大廠可以跟進一下這樣的技術,這確實相當實用。
TPU
最後,強大的AI技術是需要強大的硬體作支撐的,Google今年也是又一次更新了TPU,TPU的計算能力又一次得到了暴增。
對於很多AI晶元廠商來說,AI晶元的發熱量一直是一個讓人相當頭疼的問題,這種暴力的AI晶元和CPU一樣,高算力意味著高功耗,也意味著高發熱。
Google是直接給新一代TPU上了液冷,可見新一代TPU的暴力程度。這個液冷方式和我們平時在PC DIY領域看到的水冷有那麼一些不同,一塊TPU基板上有4個計算晶元,為了讓這些晶元都能保持「冷靜」,Google採用了這樣一種看上去很奇怪的散熱設計。
根據Google的描述TPU的算力已經可以媲美NVIDIA的GPU了,在AI晶元這一塊Google可能會和NVIDIA形成一個比較激烈的競爭,因為一旦Google公開出貨TPU或者大規模通過雲平台開放TPU,那麼NVIDIA的顯卡也好、AI專用的計算卡也好都會面臨賣不出去的尷尬處境。
整場I/O大會除了Android P以外基本上都是AI,關於Android P我們明天再說,Android P的亮點三言兩語說不完。Google在AI領域可以說是走得相當順風順水,Google自己有硬體、有技術實力、有人才儲備,筆者預計在未來三年Google的AI將進化到一個比較恐怖的程度。
不過憑藉目前晶元的計算力,筆者認為至少五年內AI還發展不到科幻電影那種境界,目前世界上還沒有任何一個AI是真正的「多面手」,你會發現所有的AI軟體都是有針對性的、功能單一或類別單一的。對於所有的AI從業人員來說,如何將現有的這些各個方面的技術做一個融合向真正的人工智慧進化才是核心問題,因為在三到五年後,AI的技術已經有比較深厚的技術積累了,基礎技術與服務框架也構建得差不多了。
在筆者看來全球未來能和Google在AI領域抗衡的估計只有中國的互聯網巨頭們了,但是在一切開始之前,我們需要足夠強悍的AI計算晶元,畢竟武器再強,扛不動,那也就只是一堆廢銅爛鐵而已。
今天的文章就到這裡,如果你喜歡本文可以掃描下方的二維碼關注我們,感謝你的支持。
這裡是技宅空格,我們明天見。
TAG:技宅空格 |