當前位置:
首頁 > 科技 > Google 人工智慧,掀開蓋子里居然有個活人

Google 人工智慧,掀開蓋子里居然有個活人

怎麼樣開一家人工智慧公司?

答案可能比「如何把大象塞進冰箱」還簡單。

文檔軟體開發商 Readme 的創始人 Gregory Koberger 曾經在社交網站上回答過這個問題:


1、請一群領最低工資的人來假裝人工智慧2、等真正的人工智慧創造出來

Gregory Koberger 當時之所以這樣說,其實是為了諷刺早前人工智慧創業公司 Edison Software 被曝出聘請員工假裝 AI 為客戶提供所謂的「智能郵件回復」服務。

事情過去也快一年了,沒想到這個梗再一次被挖了出來,更沒想到的是,這次諷刺的對象居然還是鼎鼎大名,被給予厚望改變世界的 Google。

Google 人工智慧,掀開蓋子里居然有個活人


Google 也騙人了?

準確來說是 Goolge Duplex 騙人了。

在 2018 年,Google 在 I/O 大會推出了一項人工智慧新服務:Google Duplex。這項人工智慧服務的用處,簡單來說就可以替你打電話到餐館訂位。

Jimmy Tran 是一家位於加州的泰國餐館的服務員,前些天,他接到了來自 Google Duplex 的訂位電話。

但在交談的過程中,對方濃重的愛爾蘭口音(拜託,能不能走心一點)引起了餐館小哥的懷疑。

餐館小哥也毫不含糊,直接問對方究竟是 AI 還是人,沒想到對方更直接,絲毫不掩飾,直接承認了自己其實是人。

Google 人工智慧,掀開蓋子里居然有個活人

估計餐館小哥內心覺得憋屈:等了這麼久,終於等來了 Duplex 的電話,結果你跟我說其實你是個人?於是他找《紐約時報》告狀去了。

《紐約時報》也發現事情並不簡單。於是他們也進行了十次實驗,結果發現,十次當中有四次是成功訂位的,而這四次當中僅有一次是真的通過 AI 來進行訂位的,其餘三次其實都是「演員們」的表演。

隨後,Google 也向《紐約時報》承認了此事,並表示 Duplex 所撥出的電話中,有 25% 其實是人類,而在剩下的電話中,也有 15% 進行了部分的人為干預。

顯然,百分比其實並不重要,重要的是有和無。

那麼即便神奇如 Google Duplex,也擺脫不了人工干預?

Google 人工智慧,掀開蓋子里居然有個活人


Duplex 神奇的地方,其實用處並不大

其實用「人工」裝「智能」的事也不是第一次出現了。除了文章開頭提到的「偽裝智能回復郵件」事件外,你還記得那個甚至還被授予了沙特國籍的神棍機器人 Sophia 么?

Google 人工智慧,掀開蓋子里居然有個活人

至於這次 Google Duplex 的事情之所以還能引起大家這麼大的關注,其實還是因為大家對 Google Duplex 的期望太高了。

一年前,Google Duplex 一出,「Awsome」聲四起。

驚艷的感覺從何而來?你一定會回答:太像人了。

對,太像人了。Google Duplex 甚至還通過了部分的圖靈測試——一個說到 AI 就會想到的測試,就像是 AI 的認證考試一樣。

圖靈測試簡單來說,就是把真人和 AI 都關到「小黑屋」裡面,然後在屋外安排另外一個真人輪流與他們對話。如果屋外的人無法辨別出「小黑屋」里到底哪個是真人哪個 AI,那麼則會認為這個 AI 通過了圖靈測試。

但是,通過了圖靈測試,就能說明這個 AI 能正常地與人交流了嗎?並不,因為圖靈測試的本質是模仿、是欺騙,這樣就使得 AI 在進行圖靈測試時,遇到理解不了的問題,只要它表現得足夠像人類,就可以通過假裝無知,對問題避而不談來通過測試。

Google 人工智慧,掀開蓋子里居然有個活人

▲圖片來自:Wikipedia

無可否認,在模仿人類這方面,Google Duplex 做得實在太好了,無論是語音語調、各種停頓、語氣詞等的小動作都做得與人幾乎沒什麼區別。這也是它通過圖靈測試的資本所在。

但是,即便 Google Duplex 在語音合成上做得再極致,也沒有用,因為人工智慧對話系統,關鍵不是在於話說有多像,而是能聽懂話,說對話。就好比唱歌找不著調的人,嗓音再好聽,也於事無補。


能聽懂人話其實才是關鍵

為什麼讓 AI 聽懂人話這麼難?這得從 AI 到底是怎麼理解所聽到的話(NLU 自然語言理解)說起。

包括 Google Duplex 在內的人工智慧對話系統,對聽到的每一句話,都會進行拆解,將其分成「意圖」、「實體」以及「廢話」。

例如你說一句:今天天氣真好,我想去廣州塔逛逛,幫我叫個車吧。

在這句話當中「叫車」就是「意圖」、「廣州塔」就是目的地實體,其餘就都是廢話了。

Google 人工智慧,掀開蓋子里居然有個活人

▲圖片來自:Boost.ai

那麼在這裡,第一個問題就出現了。

例如:幫我推薦一家餐廳,不要四川菜。

在這句話當中,意圖很明顯,是「推薦餐廳」但是「四川菜」依舊會被當成實體,「不要」這個重要的關鍵邏輯,則會被當成廢話。

人之所以可以理解這句話,是因為人除了可以提取關鍵詞之外,還可以進行邏輯的識別,而 AI 所缺少後面的這一步,就讓它在進行理解時,腦筋經常轉不過來。

Google 人工智慧,掀開蓋子里居然有個活人

另外,還有一個問題,讓現在的 AI 對話系統,和人類的對話系統有著巨大的差距。

無論你說的是哪種語言,你總有辦法把信息揉進語言裡面。

但是作為人類最重要的傳達信息的工具,語言系統卻並沒有我們想像中的那麼高效。我們舉個例子。


假設周日晚上你在酒吧認識了個姑娘,她迷人的臉龐加上有趣的靈魂讓你神魂顛倒。即便到了周一早上,你依舊像個花痴一樣,一想起她就傻笑。於是同事就來問你了:吃錯藥了?你回答:我昨晚遇到了一個很棒的姑娘。

那麼這個姑娘究竟有多棒?你同事並不會知道。

因為即便你在接下來的一個小時里,用盡各種語言去描述那個姑娘長得怎麼樣、不停地複述你們昨天聊的話題究竟多有趣,在你同事的腦海里,依舊無法一比一地把那個女生復刻出來。

比起我們的思維,語言確實很貧瘠,以至於實際上通過語言所傳達的信息,其實或多或少是失真的。

那麼為什麼人類還可以通過這樣的一個系統,正常傳達信息,並以此建立起延續了七千多年的文明?

這是因為我們解讀能力強。

Google 人工智慧,掀開蓋子里居然有個活人

這就好比我們的主編每天早上見到我說了一句早安後,第二句我都還沒等他開口,就已經知道他想問我稿子寫完沒。

也好比你的同事即便無法在腦海里一比一地把那個姑娘復刻出來,只要他不是從出生開始便一直單身,他都能理解你這種如沐春風的感覺。

這種基於常識、經驗、場景、直覺來解讀語言、獲取信息的能力,正正是目前僅能通過上下文進行意圖及實體提取的 AI 來說,最為缺乏的。

而想要做到十分自然的交流,這種能力必不可缺。

實際上,圖靈測試還有一個升級版:威諾格拉德模式挑戰。這個測試,就是用來檢驗 AI 能否根據常識來解讀語言的。

但可惜的是,目前的人工智慧對話系統,在該測試上,都表現得並不樂觀。

Google 人工智慧,掀開蓋子里居然有個活人

其實對於單靠深度學習,能否造出真正的人工智慧對話系統,是有學者持懷疑態度的。

深度學習並不像大家想像的那樣,你把這個 AI 造出來,然後他就會自己開始學習。目前的深度學習還停留在監督學習,以及半監督學習狀態。這也就是說必須靠人去「喂」大量的標註數據,讓 AI 的「實體」庫和「意圖」庫豐滿起來,做到無論你是說「我餓了」還是說「我想出去吃飯」AI 都知道需要為你推薦餐廳。

但事實上,即便這個庫再大,上面兩個問題其實都很難解決。

心理學家認為人的大腦有兩個系統,系統一負責處理靠直覺、習慣就能完成的事情。而系統二所負責的事情則需要通過思考來完成。

專註於人工神經網路以及深度學習的計算機學家約書亞·班吉歐認為,語言是靠系統二來處理的,但是基於深度學習的人工智慧,實際上更像是系統一。

當然,這裡並不是在傳達什麼「深度學習無用論」,因為也有另外一種觀點認為,人本身就是一種資料庫,所有經驗、常識甚至是直覺其實都可以被量化。只要解決這個統計上的問題,真正的人工智慧對話系統依舊有望可以通過深度學習去達成。更何況,即便是需要重新找另外一條路,深度學習依舊會有它的一席之位,畢竟任何一種發明的誕生,其實都是多種技術的結合。

但無論是推倒重來,還是繼續往深度學習的方向發展,想見到能夠真正能夠自然交流,而且不是朝九晚五的人工智慧對話系統,可能還需要走很長的一段路才行。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 愛范兒 的精彩文章:

Redmi 新品發布會:除了「性價比旗艦」K20 系列還有一台筆記本
真正的無人送貨來了!完美解決從車上到家門口的最後一里路的問題

TAG:愛范兒 |