螞蟻金服生物識別技術負責人陳繼東：數據驅動人工智慧引發行業變革

科技 03-08

機器之心原創

作者：高靜宜

「身份驗證是整個互聯網金融的基礎，要做到從實名到實人，生物識別在這裡起到了很重要的作用。」螞蟻金服生物識別技術負責人、全球核身平台資深專家陳繼東告訴機器之心。生物識別技術的成熟、金融支付安全性與使用體驗的更高要求，正推動互聯網金融公司、商業銀行對生物識別認證技術的開發與應用。2015 年 3 月，阿里巴巴集團執行主席馬雲在德國 CeBIT 展會開幕式上發布並演示了人臉識別支付認證技術，同年年末，螞蟻金服「刷臉」認證在支付寶和網商銀行正式上線。今年 2 月 21 日，螞蟻金服「刷臉」支付被評為《麻省理工科技評論》（MIT Technology Review）2017 年全球十大突破性技術。

據介紹，目前支付寶總共有 4.5 億實名用戶，其中 1.5 億使用過刷臉。在陳繼東看來，生物識別認證研發中的演算法、參數都是通過數據實現優化，這是一個不斷迭代的過程，而螞蟻金服的優勢就在於已經擁有大規模數據基礎。陳繼東從事大數據分析以及人工智慧十多年，帶領團隊研發世界領先的生物識別技術並應用於螞蟻金服旗下的支付寶和網商銀行，他向機器之心詳細闡述了螞蟻金服「刷臉」技術背後的細節以及應用進展。

螞蟻金服生物識別技術負責人陳繼東：數據驅動人工智慧引發行業變革

陳繼東

機器之心：自支付寶引入人臉識別技術之後，在用戶登錄、實名認證、找回密碼、商家審核、支付風險校驗等場景下全面應用，甚至有約三分之一的支付寶用戶已經體驗過這項技術。可否為我們介紹一下「刷臉」支付背後的人臉識別技術？

陳繼東：人臉識別是「刷臉」支付技術的基礎。傳統上意義上，人臉識別技術有三個核心：人臉檢測，關鍵點定位，特徵提取和比對。即首先找到圖像里人臉的位置，再找鼻子、嘴等關鍵點，提取出主要特徵並對特徵進行比對。比對分為 1：1 和 1：N 兩種方式，相應地，也存在兩種應用場景。在金融領域做身份驗證的時候，我們大部分時候是通過設備關聯到賬戶，知道用戶預留的人臉圖像，然後將活體的臉和預留的臉做一個演算法的比對，這是 1:1 的比對。而 1：N 則是從已有的人臉資料庫中找到最為相似的人臉，比如在視頻監控的場景下，實時定位畫面中人群里的臉，把臉和庫裡面已有的臉做一個 1：N 的搜索，從而找到最相似的結果。雖然這兩類比對方式應用場景不同，但技術基礎都是相同的。

人臉比對的核心演算法主要是經歷了幾個過程。最早在 20 世紀 60 年代，人們就已經開始研究人臉比對演算法了；80 年代後期，隨著是計算機技術和光學成像技術的快速發展，不同的演算法模型應運而生，最早的就是基於人臉的局部特徵的識別模型；之後，更多的是提取全局特徵後，再做一些特徵的變換；再後來還有基於二維、三維模板做人臉建模的識別模型。

這兩年，人臉識別技術取得了突破式的發展，一個是源於深度學習的深入應用，另一個就是海量數據的爆發。隨著深度學習的發展，人們可以基於神經網路讓機器模擬出人類大腦的學習過程。以前人臉識別的準確率只有 70%、80%，而通過卷積神經網路模型和海量的圖片數據進行訓練，最近兩年已經能夠到達 99.6%、甚至 99.7%，已經到了可以商用的程度。從數據的角度來說，很多演算法、參數都是通過海量數據訓練來實現優化，這是一個不斷迭代的過程。我們相比於其他人臉識別廠商的優勢正是我們已經擁有大規模數據基礎。其實，我個人的背景也不是生物識別，更多的是偏向於大數據、機器學習、人工智慧。很早我就覺得數據一定是未來的一個大方向，我做過很多數據領域的應用，比如廣告、搜索等，更關注從數據挖掘出的價值。對於金融場景下的生物識別來說，我個人認為數據的應用價值會更大。信用評估、風險管理、身份驗證等金融核心都需要數據來解決、並通過演算法精準地評估。生物識別在人工智慧領域已經比較成熟，它在數據應用方面也是最成功的案例。我對數據驅動人工智慧從而引發行業變革是十分看好的。

機器之心：對「刷臉」支付應用的定位是怎樣的？

陳繼東：《麻省理工科技評論》對於突破技術的定位主要在技術本身之外的應用，強調的是運用科技解決方案，從而帶來不同以往的改變，而這正跟我們的定位很相似。我們所希望的是整個人臉識別在金融級進行應用實踐，這是應用驅動的、需求驅動的，不是單純為了做人臉識別這個技術。一個技術能否大規模商用，很多情況下跟它應用的場景是有很大關係的。我們更關注大規模的商業應用，而不是娛樂性的、社交類的，比如說 Facebook 通過人臉識別做照片的分類，或者是預估年齡等應用，我們更偏向於身份驗證，這是一個對安全性、識別準確度要求更高的場景。

螞蟻金服生物識別技術負責人陳繼東：數據驅動人工智慧引發行業變革

2016 年雲棲大會上，螞蟻金服展區開張了一家「未來咖啡館」，客人對著攝像頭刷刷臉，就能完成支付。據悉，刷臉支付很快就將落地真實場景。

機器之心：在眾多生物識別技術中，為什麼選擇人臉識別結合眼紋識別的驗證方式？

陳繼東：生物識別在金融級的應用始於需求。簡訊、密碼體驗差，很多人記不住。比如在網路不好的情況下簡訊不可達，手機上經常被植入木馬，受到攻擊之後簡訊校驗碼很容易截獲。可能用戶在不同網站上設置相同的密碼，使密碼容易被撞庫得到。在生物識別方面，不光人臉識別，我們一直也在研發聲紋，眼紋，然後包括虹膜、掌紋、筆跡甚至是行為的特徵，也一直在進行比較。

選擇人臉識別是基於用戶的非接觸式體驗，這不同於指紋識別；還有一個原因是人們拍照是比較自然的一個習慣；另外，人臉照片可以拿來與證件上的照片、以及本人進行交叉比對。那麼，我們為什麼選擇和眼紋識別結合呢？因為刷臉的過程中也會掃描識別眼部特徵，用戶體驗是非常自然的。市場上有一些與聲紋相結合的，比如要求用戶在掃臉的過程中念一串數字，因為不同人的聲音具有唯一性，我們自己也在研究這一類演算法，也做過相關嘗試，這是雙因子的校驗。不過這個體驗跟掃臉結合掃眼這樣的雙因子比要差點，受聲音環境影響較大。未來除了主動驗證，還會發展一些被動的驗證。比如根據手機上各種感測器數據來驗證這個人，從走路的姿勢、拿手機的角度等行為來判斷是不是本人，這是一種不需要用戶參與的身份驗證方式，可以給用戶一個更加自然的體驗，也是未來我們希望去探索的一個方向。

機器之心：能否分享一下如何將人臉識別精度提升到金融交易應用級別的要求？

陳繼東：在保證極低誤識率的同時擁有很高的準確率，是人臉識別金融級精準度的基礎要求。在一般的互聯網場景下，99% 的準確率通常假設 0.1% 的誤識率（在一千次識別有一次識錯）的情況下，識對的概率也能到達 99%。但是在金融的場景下，這個誤識率是無法滿足的，這意味著有可能別人試了一千次就有一次進入我的賬戶，盜用我的資金，這個安全等級是遠遠不夠的。我們至少是需要萬分之一，甚至十萬分之一，到未來是百萬分之一的誤識率。在這個誤識率的情況下，你識對的概率能到多少呢？市面上有很多人臉識別技術公司可能只能到 60%、70%，在這種情況下，我們依然要到 90% 以上。但是這個要求對於人臉識別來說比較困難的，因為人臉本身存在一個較大的類內變化以及較小的類間變化。人臉的角度、光線、表情、年齡、化妝、遮擋、照片質量等方面會使同一個人差異比較大；在機器識別的人數增加的時候，不同的人出現長得比較像的概率也會增加，差異反而變小，這是人臉識別一個最大的難點。那麼我們如何解決這個問題呢？

有兩種方式，一種是積累足夠的數據，這就是大數據的優勢。比如以前我們的演算法對於眼鏡的識別，特別是黑眼鏡框有很大幾率的識別不準確。但是當我們的數據集里累積到很多不同的鏡框，就能學習出到底什麼樣的鏡框有什麼樣的影響，以及他們之間細微的差異，甚至我們後來還可以模擬出各種各樣的鏡框，也能達到在較低誤識率的情況下依然能保持較高的準確率。

另外一方面，在金融場景下，我們不能完全依靠人臉識別這個單一因子來做驗證。生物識別未來肯定會被廣泛應用，但不是單獨生物識別本身，一定是一個多因子的綜合驗證。很多時候，單一的演算法雖然可以看出細微的差異，但是還是有一定的漏檢率、識錯率的。那麼我們可能需要增加一個因子，這樣就可以用來分辨雙胞胎這類特殊情況。比如我們研發、獨創的眼紋識別技術。眼紋識別，又稱為眼靜脈識別，讓普通手機用戶無需額外硬體，只需普通智能手機攝像頭並在可見光環境下採集用戶眼白上的血管紋理特徵，採用針對眼部區域專門研發的活體檢測專利技術，從而抵抗人臉照片和視頻的攻擊。而且，當用戶的眼紋模板積累足夠的時候，通過眼紋比對技術還能達到接近虹膜級別的準確率和亞秒級快速識別速度，具備更高的安全性和用戶體驗。

機器之心：能否為我們介紹一下自螞蟻金服「刷臉」技術推出以來，螞蟻金服的團隊對這項技術所做出的完善以及更新過程？

陳繼東：實驗室演算法與真實大規模應用存在巨大的鴻溝。研究界有一個 LFW 公共數據集來檢測演算法，算是目前數據集裡面比較貼近於真實的數據集，但它還是一個偏實驗室的比對環境，更多用於理論研究界做演算法的提升和比較。在實驗室環境下，機器進行人臉識別的準確率已經超過肉眼，但在真實應用中還受到很多其他方面的影響，所以如果只看實驗室的數據，到真實應用的時候會發現準確率遠遠沒有那麼高。在商用的情況下，我們不是特別看重在 LFW 實驗數據集上的比對精度，因為我們更希望看見在真實數據集上面做的測試得到的準確率。在真實的應用場景下，數據差異會更大，照片是由成千上百，甚至上億的用戶在不同條件下拍照得來的，如室內室外、光線強弱、白天晚上、不同皮膚、化妝情況，甚至用戶的各種姿勢和表情。在這些真實情況下，怎麼來保證演算法的準確率，才是我們更要考慮的。

在我們拿到高質量的人臉圖像做比對的時候，比對率是比較高的，可以達到 99% 以上。但是我們更關注的是整個系統全鏈路的通過率。所謂全鏈路的通過率，指的是當用戶第一次進入刷臉界面，到順利完成刷臉並比對成功，這一個全鏈路的識別準確率。這裡涉及的因素非常多，跟產品交互、視覺設計、系統構架等都有關。比如，我們剛開始上線的時候，整體的通過率是不高的，雖然最終比對的通過率很高，達到 99% 了，但是全鏈路的通過率是非常低的。我們通過詳細的日誌分析後發現，很大一部分原因是用戶姿勢和刷臉動作不規範導致的，比如有的女生喜歡俯拍，這會導致照片很難通過質量檢測的部分。如何提升產品本身的易用性，是否需要一些引導來告訴用戶如何更加規範地使用產品，是通過圖示還是通過文字方式提升用戶體驗等交互內容，到視覺設計，設備適配，以及整個鏈路上系統的穩定性、可靠性以及實時性、甚至綜合安全策略等，都是需要很深的系統工程和產品設計的功底，以及如金融雲等安全強大的計算基礎架構。所以綜合來看，人臉識別技術的大規模應用，特別在金融場景下的應用，不僅僅是演算法問題，更多的是一個產品和系統工程問題。

另一方面，由於拍臉本身和攝像頭也有很大的關係，所以像安卓設備的碎片化也會造成一些干擾。碎片化指的是安卓的機型很多，特別是低端的設備也很多，比如攝像頭的配置、CPU 的大小、耗電量都不相同。如何兼容不同的設備，讓所有用戶有類似的體驗，適應不同的角度、光線，這需要根據線上場景有用戶、有數據，進行不斷地迭代才能做參數的優化配置、演算法的自動優化。數據的累積和用戶的嘗試都是我們所期望的。我們在 2015 年 7 月份上線，剛開始還沒有全部鋪開，基於數據驅動產品的思路，大概經過了一年的快速迭代、優化，每周都會跑一些灰度的數據，做 ABTest，調整參數，測試在什麼樣的場景下用戶通過率更高。

我們也做了很多用戶體驗的測試，比如到大街上，隨機抽取一些不同年齡段、不同收入層次的人群，測試他們對於支付寶的刷臉這一功能能否使用，是否接受，可否通過，同時通過大量的電話回訪了解真實用戶的使用場景和刷臉過程遇到的實際問題。支付寶擁有 4.5 億的實名用戶，我們的技術不是為少數人服務的，是為所有人服務的。我們希望每一個人都能利用這項技術提升體驗和安全性，使得人工智慧可以適應於更多的場景、人群、甚至是設備。

機器之心：活體檢測作為身份驗證的關鍵環節，是必不可少的。可否為我們介紹一下活體檢測過程？

陳繼東：除了人臉檢測、人臉比對之外，活體檢測是最核心的技術，也是所有生物識別里必須要解決的問題。活體檢測的演算法目前也有很多，一類是純軟體的方法，一類是與感測器相關的解決方案。例如，指紋識別是通過電容、電感感測器來檢測是否是活體、是否真實；虹膜識別是通過紅外攝像頭來完成識別活體的。然而，對於人臉來說，我們很難用特定的設備部署於手機上，比如紅外攝像頭目前在手機上普及率就很低。所以我們現在依賴一系列軟體演算法，包括基於動作交互的識別模型，以及基於圖像分析的識別模型。基於動作交互給用戶的體驗是眨眼、搖頭、張嘴，市場上的人臉活體檢測演算法大部分是基於這種動作交互的識別模型，可以檢測過程中動作的連續性。在這種情況下，照片是很難通過的，但是有一些視頻會模擬動作，或者是進行拼接產生預定的動作視頻，這類情況我們也遇到過。所以除了動作交互之外，還需要圖像的分析，比如說區分正常的圖像和通過軟體模擬、視頻剪輯的圖像之間有多大的差異。

機器之心：支付安全性是用戶關注的重點，「刷臉」支付是否存在安全隱患呢？在面對攻擊時，如何防止這種情況的發生呢？

陳繼東：其實，我們在活體檢測這一塊研發的工作量要遠遠超過人臉比對過程。因為金融場景下涉及資金損失，利益是非常大的，所以黑色產業鏈會想盡各種辦法進行攻擊，比如運用照片、視頻軟體，甚至包括市面上越來越多的換臉軟體或者是二維、三維人臉建模軟體。如果沒有活體檢測的保障，我們是無法把這項技術大規模應用於金融級的。事實上，基本市場上所有的攻擊方式，自刷臉服務上線以來，我們都經歷過，包括現在每天我們都會攔截甚至上千的攻擊量。有些是惡意的，而有些只是用戶去試著玩的。這也是一個動態的過程，所謂動態的過程就是指持續的攻防過程。黑色產業鏈會根據我們的技術進行研究從而提升攻擊能力，那我們反過來也要提升防攻擊能力、識別能力，這是一個持續攻防和不斷改進的過程。最近的技術在過去兩年有很大的發展，攻擊手段也在不斷改進。從前他們只是利用照片、視頻進行攻擊，現在更多是利用計算機圖像軟體來做人臉的合成、3D 建模，甚至他們也用深度學習的方法來做人臉的模擬。他們的攻擊越來越逼真，而我們的演算法也在不斷優化。安全是不可能做到百分之百的，很多場景下，安全保障除了活體檢測技術，還需要一整套複雜的安全策略和實時決策系統，結合環境、設備、行為等多維數據形成綜合的決策，並且能根據不同場景和攻擊手段進行動態靈活的調整。螞蟻有一套智能的大數據風控系統，可以在上面非常靈活地做實時的策略配置以及綜合決策。利用智能系統結合不同防攻擊策略、結合活體檢測，這是一個多維度的綜合防攻擊能力。

另外，還有圖像脫敏技術，數據安全和隱私保護也是很重要的。圖像脫敏就是說，不管是圖像的存儲、還是傳輸，我們希望不是原始的圖像。雖然人臉相對不是那麼隱私的數據，特別在城市中大量的攝像頭在掃描和監控人臉信息，用戶也習慣了把自己的照片上傳到網路上，但是我們從數據安全和隱私保護的角度來說，希望圖像的存儲和傳輸除了加密之外，能夠把特徵提取出來不可還原，即希望這個過程是不可逆的。這樣即使這些特徵數據被泄露、被攻擊，即使被拿走了，也不會造成什麼嚴重的後果。

本文為機器之心原創，轉載請聯繫本公眾號獲得授權。

------------------------------------------------

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 機器之心 的精彩文章:

※中國深度學習「國家隊」入場，李彥宏：「百度對人工智慧是嚴肅的」
※新一期介紹三大先鋒機器人設計：從微米級的分子機器人到長肉的人形機器人
※深思考:大腦不是計算機，也不負責信息處理
※中國95後流行色是什麼？人工智慧給出的答案是它
※IBM科學家用探針首次「堆積」出新型分子，或用於量子計算

TAG:機器之心 |

您可能感興趣

※螞蟻金服「風險大腦」技術負責人張英：螞蟻金服會將最新的區塊鏈技術與風險大腦結合
※水滴集團技術負責人閆志東：用技術管理「經營信任」
※用優秀藝術作品謳歌偉大改革開放精神——訪文化和旅遊部有關部門負責人
※滙豐控股可持續金融中心負責人一行拜訪興業研究探討綠色金融發展
※金源科技任命林鑫澤為財務負責人
※普華永道區塊鏈負責人：區塊鏈技術是瑞士銀行業發展的推動者
※谷歌AI負責人：人工智慧的發展需要與政府部門合作
※IBM研發量子計算技術負責人稱即將實現商業化目標
※阿里巴巴政府事務負責人：積極運用區塊鏈等線上技術，協助政府創新食品安全的社會治理方式
※微軟小冰產品負責人：人工智慧是如何擁有情感和智商的？
※大咖Live X 凱立德基礎研發中心產品負責人姜敏：如何構建自動駕駛地圖生態體系？
※愛刷科技財務負責人胡佳辭職
※力美科技任命李嵐為財務負責人兼信息披露負責人
※預告｜大咖Live X 凱立德基礎研發中心產品負責人姜敏：如何構建自動駕駛地圖生態體系？
※《絕地求生》創始人職位變動，將擔任藍洞新部門負責人
※賓士首款在線升級人機系統、智能數字大燈亮相CES，研發負責人揭秘創新體系
※阿里巴巴「鹿班」演算法技術負責人星瞳：用可控視覺生成引擎完成智能設計
※360商業化遊戲行業項目負責人：PC遊戲業態重構與革新
※專訪 | 阿里巴巴「鹿班」演算法技術負責人星瞳：用可控視覺生成引擎完成智能設計
※中國林業機械協會關於分支機構、代表機構設置及其負責人聘任結果