當前位置:
首頁 > 新聞 > 讓機器學會認臉究竟有多少用處?

讓機器學會認臉究竟有多少用處?

記者 | 吳洋洋

編輯 | 王姍姍

「請看鏡頭,再眨眨眼。」

只要一兩秒鐘,攝像頭就能判斷出你是不是登記信息上記錄的那個人。哪怕你在鏡頭前不小心晃了一下,聰明的鏡頭還是會認出你。至於人類常常出現的那種「臉盲症」——尤其在面對其他種族的時候,放心,只要你提前把各種面孔的圖片放進機器的資料庫,訓練它,它就極少會認錯人。

讓機器具有這種能力的是數據和演算法——數萬張打好標籤的人臉照片,以及人類賦予它或者它根據對數萬張照片的識別、自己總結出來的認知規律。

就數據而言,人類產生的數據在指數級增加。根據IBM公司估算,人類有史以來至2003年所創造的信息量為5EB(編註:EB是指Exabyte,計算機存儲單位。如果從大家還比較熟悉的較小的信息存儲單位介紹起—1TB=1024GB,1PB=1024TB,而1EB=1024PB),到2011年,人類每兩天就能產生5EB的信息量。而到2018年,人類產生這樣的信息量大概只要一個小時。

面對信息數據爆炸,技術公司最先解決的是歷史數據的存儲問題,然後是提升處理當下「高並發」數據運營的能力,而第三步,它們就開始思考如何把已經累積的這些數據復用——如果把數據的採集、傳輸、存儲、計算和應用看作一個產業鏈,計算和應用就是其中最有價值的環節。

騰訊的人工智慧團隊看上的是醫生「頭腦」中的數據。他們把一些老醫生根據CT圖片判斷疾病的經驗量化成指標,訓練出可以幫經驗不足的醫生判斷醫學影像的人工智慧產品,提高診斷的正確率。

像高德地圖這樣的移動地圖應用,則早已經可以根據用戶在路上前進時實時使用高德地圖的數據,基於用戶的地理位置信息,分析出某一路段大多數用戶的車行速度,從而推算出那條道路是否存在擁堵。

「比如一條路正面時速應該是40公里,突然發現有一段區間的用戶的時速都變成0了,就說明堵了。」阿里巴巴合伙人、高德地圖總裁劉振飛對《第一財經》雜誌說。他拿「冰山」圖形做比喻,稱高德地圖其實有兩個:一個是手機上和車載的高德地圖,「這是大家看到的高德地圖」;另一個則是看不見的高德——中國市場有超過30萬款App,包括今日頭條、美團、微博、網約車……它們所使用的定位功能,都是由高德開放平台提供的。這兩部分共同彙集成海量的人地關係大數據。加上交警部門的事故接警數據和用戶主動分享的路況、事件數據,高德甚至能區分出哪些擁堵是車輛聚集引起的,而哪些來自交通事故。

劉振飛團隊的最新嘗試,是與公安部交通管理科學研究所合作,打通一整座城市的智慧紅綠燈系統,結合各方面搜集到的實時路況數據,通過一套演算法幫助交管部門實現在雲端更加動態智能地調度所有的紅綠燈,配置更合理的時長。使用高德地圖導航的司機,也能獲知沿途紅綠燈的實時數據,這可以幫助他們更合理地控制車速,盡量避開紅燈。

上述智能紅綠燈試驗已經在無錫測試成功。不過這種二維「活地圖」不是地圖公司的最終目標。「未來自動駕駛需要的是高精地圖,它必須能分辨出來走一車道還是四車道,某個地方的欄杆有多高、紅綠燈在什麼位置,路旁邊是不是有兩棵樹。」劉振飛說。

地圖公司嘗試把地圖從二維變成三維的時候,汽車製造廠商也想在自己的汽車上裝滿感測器和攝像頭。

商湯科技是為汽車公司提供視覺方案的供應商之一。它正在測試通過攝像頭傳輸的視頻圖片識別周邊車型和物體,並通過物體長度和鏡頭之間的距離計算車間距,為自動駕駛提供決策依據。為完成識別,它也像識別人臉那樣給數萬張車輛和交通標識打過標籤。

「人90%以上的信息輸入來自眼睛,圖像和視頻是人跟這個世界交互信息的最大路徑。」商湯科技聯合創始人、副總裁楊帆對《第一財經》雜誌說,有價值的數據就是信息,當信息的載體從0、1的二進位碼演進到數字、文本、語音、圖像和視頻,數據和信息承載的形態會朝著越來越擬人化的方向發展,即未來社會生活的溝通,對人的要求會越來越低,但對機器的要求會越來越高。2014年,商湯的DeepID演算法第一次讓機器的人臉識別準確率超過了人眼識別率。

商湯科技的人臉識別技術為無人超市提供的「刷臉」無阻礙購物解決方案。

當騰訊、高德、商湯這樣的技術公司把數據「喂」給機器,讓機器開始「懂得」人的思路——賦予它規律,或者讓它自己總結規律、建立認知模型(兩種模式的相關技術都被稱作「人工智慧」,其實後者更準確的說法是「機器智能」),數據的應用場景就被進一步擴展了。

早期,這些由互聯網公司捕捉的用戶足跡還只是被用來做所謂「精準營銷」,比如你購買過啤酒,它很可能就會向你推薦紙尿褲,或者你閱讀過一篇講述小鎮青年的新聞,接下來閱讀軟體很可能會給你推送一篇工人的車間生活—根據的都是人類認知模型中的「相關性」。現在,新的數據應用場景已不限於這些現成「01」數據形態的領域了,從實體零售到交通、無人駕駛、智能製造、智慧醫療以及網路遊戲和直播,每個尚未被數字化的傳統市場也開始對數據感到興奮。

在這些新興場景中,數據的形態以語音和圖像為主,而且數據的生產(即採集)和應用是同步進行的。以無人駕駛為例,通過攝像頭或感測器收集的物理世界數據進入無人車的計算系統後,有關需要拐彎或者避讓的決策要立即作出。歷史數據對這些場景而言只有訓練機器建模的功能。

新興場景看起來已經有很多,不過這個階段,技術公司在這些細分市場的商業化速度並不算很可觀。2018年6月,凱迪拉克發布了和高德地圖合作的智能駕駛系統,高德地圖提供了導航中需要的「高精地圖」。這套系統達到L3級別——司機可以在駕駛過程中放開雙手,但行駛範圍僅限於一段30公里的高速公路。想讓這輛車在L3的狀態下駛入北京、上海這樣的大都市,還要再等幾年,因為隨著路況變複雜,製作高精地圖的成本和難度也迅速上升,可能還需要發射衛星。目前對高精地圖的繪製,還處於早期實驗階段。

Google於2019年1月2日獲批的一款基於雷達的動作感應設備——Soli感測器也面臨同樣的問題,Soli感測器可以使用雷達波束捕捉三維空間里的動作,讓用戶按壓拇指和食指指尖上的虛擬按鈕,或者通過拇指和食指之間的摩擦來完成虛擬撥號。

做技術出身的劉振飛表示,儘管現在計算能力大幅提升、機器設備越來越智能,但我們應該正視理念與現實之間存大的巨大差距:「你做一個樣片、一個局部的演示可以,但是如果做成你能用、我能用、家裡父母都能用的東西,就需要巨大成本,那是一個工程技術。我們在一步一步探索。」

就自動駕駛而言,所有計算都必須要在毫秒級時長內完成,才對自動駕駛決策有意義。這既有賴於5G商用,也需要終端設備完成從功能機到智能機的硬體革命——不僅車要夠智能,路也要夠智能。實際情況是,國內的紅綠燈和交通部門使用的絕大部分攝像頭都是不聯網的。有些紅綠燈甚至還需要人工做手動控制,每過30秒或1分鐘,由專門管理信號燈的人士去扳一次開關。

醫療數據的用戶隱私性和醫療安全問題,令「騰訊覓影」這樣的醫療影像識別產品至今沒能拿到可以商用的醫療器械牌照。因為國內的商業保險並不發達,國內的影像識別公司也還沒找到願意為其技術買單的對象。

按照商業化的難易度,楊帆把結合了人工智慧技術的數據應用場景分為「頭部場景」和「長尾場景」兩類。自動駕駛、醫療影像識別、智慧城市項目,在他看來都算得上是「頭部」場景——它們也是各大公司在人工智慧領域投資同質化的主要原因之一。而更多場景其實存在於「長尾」部分。

「我們早年看好用視覺識別做工業4.0,但後來發現這個領域沒有我們一開始想像的那麼好,關鍵原因是它裡面的場景特別地細分。每個生產線面臨的問題,泛泛來說都可以叫『視頻分析』,但每種演算法要解決的問題都不一樣。」楊帆解釋說,如果要為每一個細分場景都開發一套演算法,前提必須是場景經過演算法優化所帶來的商業回報,要能支撐技術成本。所以,只有通過不斷升級深度學習訓練體系,推進演算法生產環節的標準化,打通不同場景的技術壁壘,降低產品開發成本,才能讓技術有機會進入更多零散小量、個性化的「長尾」場景。

某個城市的治安部門曾提出要在河邊設置一個攝像頭,一旦有人跳河就能自動報警。這件事從技術上可行,挑戰是至少需要上萬張的人跳湖影像——根據楊帆的經驗,「萬級」的數據是訓練機器的基數——才能訓練出一個跳湖提示演算法,而這個演算法可能「只適應某個地方跳湖,換一個地方就不行了」。這是個極端的場景需求,但它也反映出數據產品化的過程會遇到原生數據不足的問題。

模擬訓練是解決原生數據不足的一種辦法。商湯利用真實渣土車標註數據,以及將渣土車圖像嵌入視頻的模擬訓練等技術,實現了當城市攝像頭拍到違規進城的渣土車,立即觸發實時報警的功能。

Google雲前AI首席科學家、斯坦福大學教授李飛飛曾提及她帶領團隊開發一款老人監護產品—在老人摔倒時,機器能夠報警。但是要實現這個功能,前提是要有上萬張老人摔倒的行為影像數據。最後,他們通過讓人模擬老人摔倒解決了這個問題。在矽谷,因此還誕生了一些專門生產模擬數據的機構。

模擬數據能解決數據量不足的問題,但仍面臨數據多樣性的挑戰。很多場景的原始數據如果連最基本的多樣性覆蓋都保證不了,就沒辦法模擬。「模擬什麼樣的人跳河是真的跳河,什麼樣是假的呢?如果你模擬的東西不夠真,你不知道機器會學出來什麼。」楊帆這樣解釋其中的複雜性。

數據不僅是一種資產,更是一種資源。從商業價值上看,數據只有以用戶為中心建構才能獲得最大的變現價值。高德地圖的母公司阿里巴巴目前有三大數據池——淘寶、支付寶和高德地圖,它們分別意味著人與商品、人與資產、人與位置。假如將這三類數據打通,阿里巴巴能做的生意就不會僅僅是讓高德幫助盒馬鮮生決定選在哪裡開店最好,它將實現真正的線上線下打通。但阿里巴巴迄今還沒有打通這三者之間的底層數據。因為身為技術公司必須要兼顧商業效率與數據安全的問題。數據安全,在很大程度上指的是對用戶個人隱私的保護。

在為開發一套還原真實物理世界的「高精地圖」感到興奮的同時,劉振飛也在思考:數據能解決所有的問題嗎?

2016年,他的團隊和公安部合作了一個尋找丟失兒童的公益項目。整個過程中並沒有用到攝像頭和人臉識別,而是靠高德的定位能力和釘釘為公安打拐系統的六千多名專門負責(找孩子)的警察開發了協同辦公插件。當有兒童丟失時,當地民警通過釘釘發布尋人信息,藉助高德的地理圍欄和基於位置的推送(LBP)技術和介面,直接向指定範圍內的高德用戶推送這條消息。當有用戶自願提供線索時,專職民警會負責核實—這種找法和傳統流程沒有什麼不同,但辦事效率極大提升。這個名為「團圓」的項目,在兩年內發布了3419條兒童丟失信息,而找回率高達到98.4%。

「後來我們想再做個尋找丟失老人的項目就很難。倒不是技術和錢的問題,而是缺乏明確的政府部門去管這件事,目前沒有像找孩子那樣的專職找老人的團隊。」這件事讓劉振飛意識到不是所有的問題都能用技術來解決,「一開始我們也想過在火車站、汽車站搞攝像頭,後來發現這件事光靠技術還是不夠的。所以,有時候我們也不能過於理想化地誇大技術的能力。」

本文版權歸第一財經所有,

未經許可不得轉載或翻譯。

吳洋洋

關注消費與科技,推薦好玩的或吐槽請聯繫


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 第一財經周刊 的精彩文章:

蘋果、Facebook、藍山資本教你如何破除大公司病,實現敏捷發
在嗎?來和富大人聊天了

TAG:第一財經周刊 |