業界｜AI技術不是趨同，而是正在放大差距

新聞 05-21

「暴火」了兩年多之後，在中國人工智慧領域，漸漸有了更多理性思考的發聲。在 5 月 19 日召開的 2018 年中國圖靈大會上，依圖科技 CEO 朱瓏博士就講到：AI 發展太快，全球研究的積累不夠的背景下，各種 AI 觀點甚囂塵上，技術上難辨真假、好壞，AI 跳躍性的發展也使得 AI 進入到沒有技術權威的時代，並且這是整個時代呈現出的特點。

依圖是誕生於 2012 年的一家人工智慧創業公司，CEO 朱瓏創辦依圖前，在美國做過十多年 AI 相關的研究，15 年前他還在微軟亞洲研究院做過研究。在美國期間，朱瓏先是在 UCLA 讀統計建模和統計學計算方向的博士，當時他的導師叫艾倫·尤爾，艾倫的博士導師就是著名的理論物理學家霍金。後來，朱瓏進入麻省理工學院的 AI Lab，做計算機視覺建模相關的博士後研究員；回國創業前，朱瓏在深度學習爆發之前 Yann Lecun 的實驗室做研究。

業界｜AI技術不是趨同，而是正在放大差距

既有強大的學術界的背景，又在工業界創業期間歷經中國 2012 到 2018 年，朱瓏深感於中國發生的巨大變化——在過去中國沒有成熟的科技創業的情景和市場機制，而這幾年開始，中國各種背景的人在一起交流的越來越多，並且這已經是新的形態。他解釋說，過去，政府、投資者、媒體這三者是比較頻繁交流的，但是在 2012 年之前，學術界不像今天這樣經常會被政府邀請來交流，也不會被一流的投資基金邀請交流。

那麼人工智慧技術的發展是否也進入了新的形態？最近甚至有一些討論：技術是不是發展到了瓶頸？各項演算法之間有沒有區別？

AI 技術不是趨同，而是正在放大差距

隨著 AI 熱潮的湧現，各家 AI 公司都會頻繁參加一些比賽以證明自己的演算法實力，以人臉識別演算法為例，各家 AI 公司在 LFW 等類似的計算機視覺比賽中都取得 99.xx% 的成績。於是人們會問：AI 演算法是否已經趨同了？如果演算法精度差別不大（只有幾個百分點），是否意味著創業公司的技術已經同質化了，沒有技術創業的核心競爭力了呢？

實際上，這是典型的認知誤區。我們在朱瓏的演講中看到了一張表，可能更準確的回答了這個問題，這是中國某省 1 億人像庫，在真實刑偵案件的破案環境下性能測試的對比表，參與方是知名的幾大人臉識別公司：

業界｜AI技術不是趨同，而是正在放大差距

我們可以這樣理解這張圖：必須對應場景來談演算法精度。不同場景的演算法精度不具備任何可比性，甚至不代表有相關性。換句話說，簡單場景下演算法精度高，不代表在複雜的高難度場景下有更大的概率可以把演算法精度做高。好比在小學考試中拿滿分，未必能在大學考試中也拿滿分。

如今，很多學術界比賽使用的都是公開數據集，數據集內多是互聯網照片，相當於是一場難度不大的開卷考試，「考生」很容易就可以把測試成績刷到比較高，這就出現了上面提到的，各家 AI 公司類似 LFW 之類的計算機視覺比賽中都能取得 99.xx% 的成績。

然而，在實際應用中，技術遇到的會是各種無法預見的高難度場景，包括變形、昏暗、逆光、強光、光照不均、低清、運動模糊、遮擋、跨年齡段比對、面部變形等等，在這種情況下，各家的差距被迅速拉開，第二名和第一名的錯誤率能相差幾倍以上，遠未到趨同的程度。

進入實戰後，技術的差距體現在具體產品或應用上，不是簡單的好用和一般好用的差距，而是可用和不可用的差距，而實戰中是要以最高效率解決實際問題為目的。假如在一個 1 億級別的人像系統中進行 1：N 的靜態比對，錯誤率相差幾倍，就導致使用者的做事效率下降幾倍。即便使用者是在一個多演算法平台上，久而久之，他也只會傾向於使用第一名的演算法。

可見，人工智慧技術不是趨同，相反，是正在放大差距！

AI 提供了一把「尺子」，幫助探索人類智慧邊界

依圖科技曾經做過一個實驗，在千萬量級的身份資料庫上，一個人將女朋友的生活照輸入進去，在 AI 輸出相似度前十的照片中，這個人完全無法辨別哪張照片上面的臉屬於他的女朋友。這意味著，AI 從過去識別生人的能力比人強，到今天，識別熟人的能力也已經超越人類了。

這就引發了另外一個問題：我們人類自身的識別能力的規模和精度，到底是什麼程度的？朱瓏在現場展示了下面這張相似度分布圖：

業界｜AI技術不是趨同，而是正在放大差距

右上角是輸入的人像圖片跟自己身份證件照的比對，相似度分數是 98 分；跟自己十年前的照片相比是 97 分；跟自己的聖誕節彩妝照（採光清晰）比對得到了 88 分；跟自己兒童時代的照片比是 76 分；在重度化妝之後，就跌到了 40 分。

最右下角是一對同卵雙胞胎，在機器眼中，它們的相似度達到 98 分；往左一組，是一個機構里最像的兩個人（非雙胞胎），它們的分數能達到 90 分；再往左一組，相差幾歲的姐妹相似度為 64 分；而網友覺得很像的姚明和李宇春，機器打了 60 分。據說，2013 年第 57 屆韓國小姐，前 18 名佳麗的兩兩間平均相似度是 63 分，很接近姐妹；18 位中最像的一對達到驚人的 90 分！

在過去，人類無法做任何科學實驗來獲取結果，然而今天有了人工智慧，機器可以提供一個非常穩定的表現，當識別數據規模非常大的時候，也能夠很輕易地識別 1 億人、10 億人。這樣一來，機器識別相當於提供了一把尺子，根據相似度比例篩選出來給人去測，可以在有效的時間裡面，測出一個人自己「看」這個世界的能力。而這也是人類第一次有一個非常穩定的機器，具備識別能力，可以看到人和機器智能的差別程度。

依圖還做了另外一個頗為有趣的實驗：在 13 億中國人中有多少人跟你長的一模一樣？「一模一樣」的定義是連自己的媽媽也辨別不出來。

實驗的結果是，每 1 億人當中就有一個人跟自己長的一樣，這「一億分之一」的區分度意味著什麼呢？每 1 億人當中就有一個人跟你長的像，又意味著什麼？或許可以從人類基因進化的角度做一些解讀。

業界｜AI技術不是趨同，而是正在放大差距

在人類進化過程中，視覺識別能力在各大感官中的比重越來越大，也許是因為人類開始進行穿著，人嗅覺識別家庭成員的能力與其他哺乳動物相比，算是比較低下，甚至人類主要就是通過看人臉來辨別同類。選擇壓力驅使人類的臉之間的區分度需要盡量的大，這樣才能保證家庭成員的穩定性得到保障。

作為社群動物，人需要和大量同類打交道，而臉部識別錯誤的代價將是失去整個基因組的遺傳繼承。就好比，人類出門回家後，認不出自己的孩子、父母、老婆，一定會引發社會動蕩，影響到人類的基因進化。

實際上，對應的編碼人臉形狀的基因數量需要很大，目前知道有一條染色體的一大塊用於編碼臉部特徵。而一億分之一的識別度將是一個具有巨大社會學意義的統計數值，背後還會有更多的生物學意義也值得更近一步的探討。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 機器之心 的精彩文章:

※如何使用Docker、TensorFlow目標檢測API和OpenCV實現實時目標檢測和視頻處理
※專訪｜體素科技：全病種醫療影像閱讀者

TAG:機器之心 |