當前位置:
首頁 > 新聞 > 業界|AI技術不是趨同,而是正在放大差距

業界|AI技術不是趨同,而是正在放大差距

「暴火」了兩年多之後,在中國人工智慧領域,漸漸有了更多理性思考的發聲。在 5 月 19 日召開的 2018 年中國圖靈大會上,依圖科技 CEO 朱瓏博士就講到:AI 發展太快,全球研究的積累不夠的背景下,各種 AI 觀點甚囂塵上,技術上難辨真假、好壞,AI 跳躍性的發展也使得 AI 進入到沒有技術權威的時代,並且這是整個時代呈現出的特點。

業界|AI技術不是趨同,而是正在放大差距

依圖是誕生於 2012 年的一家人工智慧創業公司,CEO 朱瓏創辦依圖前,在美國做過十多年 AI 相關的研究,15 年前他還在微軟亞洲研究院做過研究。在美國期間,朱瓏先是在 UCLA 讀統計建模和統計學計算方向的博士,當時他的導師叫艾倫·尤爾,艾倫的博士導師就是著名的理論物理學家霍金。後來,朱瓏進入麻省理工學院的 AI Lab,做計算機視覺建模相關的博士後研究員;回國創業前,朱瓏在深度學習爆發之前 Yann Lecun 的實驗室做研究。

業界|AI技術不是趨同,而是正在放大差距

既有強大的學術界的背景,又在工業界創業期間歷經中國 2012 到 2018 年,朱瓏深感於中國發生的巨大變化——在過去中國沒有成熟的科技創業的情景和市場機制,而這幾年開始,中國各種背景的人在一起交流的越來越多,並且這已經是新的形態。他解釋說,過去,政府、投資者、媒體這三者是比較頻繁交流的,但是在 2012 年之前,學術界不像今天這樣經常會被政府邀請來交流,也不會被一流的投資基金邀請交流。

那麼人工智慧技術的發展是否也進入了新的形態?最近甚至有一些討論:技術是不是發展到了瓶頸?各項演算法之間有沒有區別?

AI 技術不是趨同,而是正在放大差距

隨著 AI 熱潮的湧現,各家 AI 公司都會頻繁參加一些比賽以證明自己的演算法實力,以人臉識別演算法為例,各家 AI 公司在 LFW 等類似的計算機視覺比賽中都取得 99.xx% 的成績。於是人們會問:AI 演算法是否已經趨同了?如果演算法精度差別不大(只有幾個百分點),是否意味著創業公司的技術已經同質化了,沒有技術創業的核心競爭力了呢?

實際上,這是典型的認知誤區。我們在朱瓏的演講中看到了一張表,可能更準確的回答了這個問題,這是中國某省 1 億人像庫,在真實刑偵案件的破案環境下性能測試的對比表,參與方是知名的幾大人臉識別公司:

業界|AI技術不是趨同,而是正在放大差距

我們可以這樣理解這張圖:必須對應場景來談演算法精度。不同場景的演算法精度不具備任何可比性,甚至不代表有相關性。換句話說,簡單場景下演算法精度高,不代表在複雜的高難度場景下有更大的概率可以把演算法精度做高。好比在小學考試中拿滿分,未必能在大學考試中也拿滿分。

如今,很多學術界比賽使用的都是公開數據集,數據集內多是互聯網照片,相當於是一場難度不大的開卷考試,「考生」很容易就可以把測試成績刷到比較高,這就出現了上面提到的,各家 AI 公司類似 LFW 之類的計算機視覺比賽中都能取得 99.xx% 的成績。

然而,在實際應用中,技術遇到的會是各種無法預見的高難度場景,包括變形、昏暗、逆光、強光、光照不均、低清、運動模糊、遮擋、跨年齡段比對、面部變形等等,在這種情況下,各家的差距被迅速拉開,第二名和第一名的錯誤率能相差幾倍以上,遠未到趨同的程度。

進入實戰後,技術的差距體現在具體產品或應用上,不是簡單的好用和一般好用的差距,而是可用和不可用的差距,而實戰中是要以最高效率解決實際問題為目的。假如在一個 1 億級別的人像系統中進行 1:N 的靜態比對,錯誤率相差幾倍,就導致使用者的做事效率下降幾倍。即便使用者是在一個多演算法平台上,久而久之,他也只會傾向於使用第一名的演算法。

可見,人工智慧技術不是趨同,相反,是正在放大差距!

AI 提供了一把「尺子」,幫助探索人類智慧邊界

依圖科技曾經做過一個實驗,在千萬量級的身份資料庫上,一個人將女朋友的生活照輸入進去,在 AI 輸出相似度前十的照片中,這個人完全無法辨別哪張照片上面的臉屬於他的女朋友。這意味著,AI 從過去識別生人的能力比人強,到今天,識別熟人的能力也已經超越人類了。

這就引發了另外一個問題:我們人類自身的識別能力的規模和精度,到底是什麼程度的?朱瓏在現場展示了下面這張相似度分布圖:

業界|AI技術不是趨同,而是正在放大差距

右上角是輸入的人像圖片跟自己身份證件照的比對,相似度分數是 98 分;跟自己十年前的照片相比是 97 分;跟自己的聖誕節彩妝照(採光清晰)比對得到了 88 分;跟自己兒童時代的照片比是 76 分;在重度化妝之後,就跌到了 40 分。

最右下角是一對同卵雙胞胎,在機器眼中,它們的相似度達到 98 分;往左一組,是一個機構里最像的兩個人(非雙胞胎),它們的分數能達到 90 分;再往左一組,相差幾歲的姐妹相似度為 64 分;而網友覺得很像的姚明和李宇春,機器打了 60 分。據說,2013 年第 57 屆韓國小姐,前 18 名佳麗的兩兩間平均相似度是 63 分,很接近姐妹;18 位中最像的一對達到驚人的 90 分!

在過去,人類無法做任何科學實驗來獲取結果,然而今天有了人工智慧,機器可以提供一個非常穩定的表現,當識別數據規模非常大的時候,也能夠很輕易地識別 1 億人、10 億人。這樣一來,機器識別相當於提供了一把尺子,根據相似度比例篩選出來給人去測,可以在有效的時間裡面,測出一個人自己「看」這個世界的能力。而這也是人類第一次有一個非常穩定的機器,具備識別能力,可以看到人和機器智能的差別程度。

依圖還做了另外一個頗為有趣的實驗:在 13 億中國人中有多少人跟你長的一模一樣?「一模一樣」的定義是連自己的媽媽也辨別不出來。

實驗的結果是,每 1 億人當中就有一個人跟自己長的一樣,這「一億分之一」的區分度意味著什麼呢?每 1 億人當中就有一個人跟你長的像,又意味著什麼?或許可以從人類基因進化的角度做一些解讀。

業界|AI技術不是趨同,而是正在放大差距

在人類進化過程中,視覺識別能力在各大感官中的比重越來越大,也許是因為人類開始進行穿著,人嗅覺識別家庭成員的能力與其他哺乳動物相比,算是比較低下,甚至人類主要就是通過看人臉來辨別同類。選擇壓力驅使人類的臉之間的區分度需要盡量的大,這樣才能保證家庭成員的穩定性得到保障。

作為社群動物,人需要和大量同類打交道,而臉部識別錯誤的代價將是失去整個基因組的遺傳繼承。就好比,人類出門回家後,認不出自己的孩子、父母、老婆,一定會引發社會動蕩,影響到人類的基因進化。

實際上,對應的編碼人臉形狀的基因數量需要很大,目前知道有一條染色體的一大塊用於編碼臉部特徵。而一億分之一的識別度將是一個具有巨大社會學意義的統計數值,背後還會有更多的生物學意義也值得更近一步的探討。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器之心 的精彩文章:

如何使用Docker、TensorFlow目標檢測API和OpenCV實現實時目標檢測和視頻處理
專訪|體素科技:全病種醫療影像閱讀者

TAG:機器之心 |