人臉識別的「生意經」
「2019 Python開發者日」,購票請掃碼諮詢
作者 | Jeff John Roberts
譯者 | 孫薇
責編 | 琥珀
出品 | AI科技大本營(ID:rgznai100)
導語:不經意間,科技公司便拿著你的照片,推動了人臉識別技術的蓬勃發展,這些公司大多數要麼經歷了主營業務的轉變,要麼承受了商業模式的轉變,其中還涉及多方利益群體。本文帶你一探究竟。
人臉識別軟體是一種非常強大的技術,對用戶隱私構成了嚴重威脅。同樣,這個行業目前發展十分迅猛。如今,十數家初創公司和科技巨頭正在向酒店、零售店,乃至學校提供人臉識別服務。由於新演算法較五年前能更為精確地識別人臉,行業發展非常迅速。這些科技公司將數十億的人臉素材用以訓練,並改進這些演算法,而這通常無需任何許可。事實上,包括你在內,很有可能所有人的數據都被人臉識別公司用於 「訓練集」 中,或存在於某個公司的客戶數據集里。
面對這樣的情況,消費者可能會感到驚訝。例如,在至少三起案件中,科技公司通過用戶手機上的拍照應用,獲得了數百萬張人臉圖像。目前,針對人臉識別軟體的法律限制尚無,這意味著人們幾乎無法阻止這種情況發生。
2018 年,華盛頓特區附近機場的 「登機道」 上,有一台攝像機採集著匆匆走過的 「路人」 臉孔數據。不過實際上,這只是美國國家標準與技術研究所(NIST)的模擬系統用於展示該裝置 「在野外」 是如何收集人臉數據的。NIST 會定期舉辦人臉識別軟體競賽,邀請全球公司參與,這些由志願者自願貢獻的人臉數據將用於競賽。
早期人臉識別技術便是通過這樣的方式來運作的,學術科研人員會請求用戶許可。而如今,科技公司站在了人臉識別技術的前沿,他們不太可能在使用人臉數據時請求明確的許可。
據研究機構 Market Research Future 報道,人臉識別行業競爭激烈,人臉識別軟體的市場正在以每年 20% 的速度擴張,預計到 2022 年,市值將達每年 90 億美元。其商業模式之一則是:向客戶發放軟體許可,允許他們使用自己的人臉識別程序,這些客戶包括執法部門、零售商、中學等。
在公司參與的此類軟體開發競賽中,如果演算法能夠精確識別人臉,並不會導致偏差,該公司就能獲勝。與人工智慧的其他領域一樣,開發出人臉識別的最佳演算法,意味著需要積累大量的人臉數據。雖然科技公司能夠使用政府和大學取得許可的數據集,如耶魯人臉資料庫(Yale Face Database),但這些訓練集的數據相對較少,人臉數據僅有數千個。此外,這些官方數據集還有其他局限性,許多缺乏多樣性,或者未能包含諸如陰影、戴帽或化妝等條件,因而不夠真實。為了建立起能在真實場景下探測人臉的識別技術,科技公司需要更多的圖像。
FaceFirst 公司 CEO Peter Trepp 表示,「數百、數千根本不夠,需要數以百萬計的圖像。如果缺乏戴眼鏡或不同膚色人種的數據訓練庫,則無法得到準確結果。」 這是一家位於加州的人臉識別公司,幫助零售商篩選出犯罪分子,將其擋在門外。
從應用服務提供商轉為 AI 公司
公司從何處尋覓數百萬張圖像訓練軟體?來源之一是警局的人臉資料庫,也可以找私人公司購買。加州的 Vigilant Solutions 公司就提供人臉數據「服務」,其中包含一個 1500 萬張面孔的人臉數據集。
然而,一些初創公司已經找到了更好的面孔來源——用戶的 「個人相冊」 應用。這些應用可編輯用戶手機相冊中的照片,通常包含同一個人在多個姿勢和情境下的多張圖像——這可是訓練集的海量數據源。
Ever AI 的 CEO Doug Aley 表示:「我們有客戶在數千種不同的場景中被標記同一人,站在陰影中的,戴著帽子的,凡你能想到的。」Ever AI 是一家舊金山的人臉識別初創公司,於 2012 年推出 EverRoll,這是一款幫助消費者管理一大堆照片合集的應用。
Ever AI 已獲投 2900 萬美元,投資者包括 Khosla Ventures 和其他矽谷風險投資公司。在美國國家標準與技術研究所最近的競賽中,取得 「面部照片」 分類中第二名,「自然環境面孔」分類第三名。Aley 將成績歸功於公司龐大的照片資料庫,據 Ever AI 統計,該資料庫中約有 130 億張圖片。
初期,Ever AI 還僅是個照片應用時,其激進的營銷策略曾引發爭議,並暫時導致 App Store2016 年將 EverRoll 下架——這款應用誘使用戶向其手機聯繫人發送推廣鏈接,還被用戶指責攫取私人數據,。根據 Greg Miller 2015 年在 FB 上的評論,「該程序在安裝後立即收集你的通訊錄,即刻給所有人發消息…… 然後開始拉取你的照片,上傳至雲端。」四年後,Miller 驚訝地發現,曾叫作 EverRoll 的應用程序仍存有他的照片,而且現在它已成為人臉識別公司了。
Miller 對我們表示,「不,我當時沒有意識到,也完全不能同意。所有這些都是真實存在的問題,不再有隱私,這隻會讓我害怕。」
Ever AI 的 CEO Aley 則表示,該公司不會將其資料庫的個人信息泄漏出去,僅用於訓練軟體。他還表示,該公司類似社交媒體,用戶可以選擇退出。 Aley 還否認 Ever AI 從一開始就打算向人臉識別方向發展,並表示關閉照片應用是商業方面的決策。目前,Ever AI 的用戶分布在各行各業,包括公司 ID 管理、零售業、電信通訊業以及法律執行部門。
EverRoll 也並不是唯一轉向人臉識別的相冊應用提供商。舊金山的初創公司 Orbeus 於 2016 年被亞馬遜悄然收購,它也曾提供過一個名為 PhotoTime 的熱門圖片管理應用。據內部人士透露,Orbeus 的 AI 技術以及海量人像資料庫促成了這次收購。由於簽有保密協議,這位員工不肯透露身份,但他表示「亞馬遜尋求的就是這些功能,他們在收購後關閉了這款應用。」
如今 PhotoTime 已不復存在,不過亞馬遜還在繼續銷售另一款 Orbeus 的產品,名為 Rekognition。這款產品供執法機關及其他組織用於人臉識別。亞馬遜公司拒絕透露 Orbeus 的相冊應用在多大程度上用於訓練 Rekognition 軟體,只是說這款軟體將各種來源的數據用於其人工智慧項目——包含人臉識別,並表示他們並沒有使用用戶的 Prime 照片訓練演算法。
總部位於西雅圖的 Real Networks 則是另一家使用其用戶照片軟體來訓練其人臉識別演算法的公司,這家公司的在線視頻播放器一度非常著名,而如今則專註於針對學校孩童的人臉識別軟體。同時它還提供了一款針對家庭用戶的智能手機應用,名為 RealTimes,有評論稱這款應用背地裡竊取人臉數據。
美國喬治城大學的教授 Clare Garvie 在人臉識別領域曾發表過很有影響力的報告,他表示「該應用允許用戶製作自己照片的視頻幻燈片。想像一下,一位母親將照片放在幻燈片里,再發給孩子的祖母。而這些圖像將用於識別孩子們面孔的數據集訓練,真是可怕。」Real Networks 證實,這款照片應用確有助於改善其人臉識別工具,但他補充還使用了其他數據源。
從所有這些案例中可以看出,科技公司使用照片應用收集人臉數據時,並沒有徵求用戶的明確許可。相反,這些公司只需要通過服務條款獲得法律認可即可。
然而,相比某些人臉識別公司,這已經算好的了。據美國國家標準與技術研究所人臉識別競賽的負責人 Patrick Grother 表示,人臉識別公司編寫程序從 SmugMug 或 Tumblr 等網站上 「抓取」 圖片十分常見。這些情況下,他們捕獲用戶數據並用於訓練集時,甚至連遮掩都沒有。
美國全國廣播公司 (NBC) 最近一篇報道強調了這種 「自助」 做法,並詳細描述了 IBM 如何從照片共享網站 Flickr 上竊取了 100 多萬張人臉用於 AI 研究的。IBM 研究部門人工智慧技術主管 John Smith 告訴 NBC 新聞,該公司致力於「保護個人隱私」,如果用戶希望從數據集中刪除個人數據,他們也願意配合。
所有這些都引發了人們的疑問:這些公司在保護他們所收集的人臉數據時,究竟做了哪些工作?政府又是否該給予更多監督?隨著人臉識別技術發展到社會更多領域,並成為各大小公司的業務支持時,這些問題只會更為顯著。
從商店到學校
人臉識別軟體並不新鮮。該技術的雛形初現於 20 世紀 80 年代,當時美國的數學家正開始用一系列數值來定義人臉,並用概率模型來匹配。佛羅里達州坦帕市的安保人員在 2001 Super Bowl 上使用了它,賭場也使用這一技術多年。但過去幾年裡,情況發生了變化。
美國國家標準與技術研究所的 Grother 說:「人臉識別正歷經革命。」他補充道,在高模糊或低質量圖片中,這種變化最為明顯。「底層技術已發生變化,新一代演算法取代了舊技術,它們非常有效。」
人臉識別的這場革命正更廣泛地改變人工智慧領域,而這得益於兩大因素:首先是新興的深度學習科學,這是一種類似人腦的模式識別系統:二是前所未有的海量數據,這些數據可以在雲計算的幫助下以低成本存儲和解析。
毫無疑問,最先充分利用這些新發展的公司是谷歌和 Facebook。2014 年,社交網路首推 DeepFace 程序,該程序可以識別兩張臉是否同屬一人,準確率高達 97.25%,幾乎相當於人類在同一測試中的得分。據安全公司 Gemalto 稱,一年後谷歌憑藉 FaceNet 程序獲得頭名,達到百分之百的準確率。
如今,這些公司以及微軟等科技巨頭在人臉識別領域均處於領先地位,這在很大程度上是因為它們可以訪問大量的人臉資料庫。儘管如此,在不斷增長的人臉識別市場上,越來越多的初創公司也在尋找自己的位置,它們也取得了極高準確率。
僅在美國,就有十幾家這樣的初創公司,包括 Kairos 和 FaceFirst。根據披露過去幾年數十宗投資的市場研究公司 PitchBook 的數據顯示,矽谷不斷湧現出該行業的公司。據 PitchBook 的數據,過去三年該行業的平均總投資為 7870 萬美元。以矽谷的標準來看,這個數據不算多麼驚人,但反映出風險投資的重大抉擇,即至少有幾家人臉識別初創公司將迅速成長為大公司。
人臉識別公司的商業模式仍在不斷湧現。今天,大多數公司都以銷售軟體許可為主要商業模式。根據 Crunchbase 的數據,Ever AI 和 FaceFirst 等初創公司的年收入相對較少,從 200 萬美元到 800 萬美元不等。與此同時,亞馬遜和其他科技巨頭並沒有透露自己銷售人臉識別軟體的收入份額。
多年來,最熱衷於人臉識別的付費客戶一直是執法機構。然而,最近有越來越多公司,包括沃爾瑪將這類軟體用於識別和了解實體店的客人。
加州 FaceFirst 的客戶顯然就是這種情況。該公司向數百家零售商銷售人臉識別軟體,其客戶包括一元店和藥店。FaceFirst 的 CEO Trepp 表示,公司大部分客戶使用這項技術篩選識別進入商店的罪犯,但有越來越多的零售商正在嘗試別的用途,如識別 VIP 客戶或僱員。
與此同時,亞馬遜似乎在尋找人臉識別新的商業模式方面也很積極。據報道,這家零售巨頭除向警方銷售產品外,還在與酒店合作,協助其加速入住手續的辦理程序。「各地的公司都來到亞馬遜,並表示"希望我們實現這些功能"。然後我們發現這確實是最佳選擇。」在亞馬遜收購人臉識別公司 Orbeus 時加入該公司的某匿名人士表示。
就亞馬遜而言,這些努力並非沒有爭議。去年七月,美國公民自由聯盟 (ACLU) 對該公司的軟體進行了測試,將所有國會議員與一個重罪犯人的資料庫進行了比對。該測試有 28 個誤報,其中大多數是有色人種。作為回應,美國公民自由聯盟呼籲禁止執法部門使用面部識別技術。與此同時,亞馬遜的員工也向公司施壓,要求其證明向警察部門、美國移民和海關執法部門出售軟體的正當性。包括紐約州民主黨眾議員 Jerrold Nadler 和俄勒岡州民主党參議員 Ron Wyden 在內的一些國會議員已要求政府問責部門調查人臉識別軟體的使用情況。企業領導人也對這項技術的應用感到不安,其中包括微軟總裁 Brad Smith,他在去年 12 月時便呼籲政府對這項技術進行監管。
儘管擔憂還在擴散,但隨著這些公司開發出了新的應用以出售人臉識別技術,人臉識別技術的應用範圍仍在擴大。其中就包括家庭照片應用程序的開發商 Real Networks,該公司正在向全美國的 K-12 學校免費提供該軟體。Real Networks 表示,有數百所學校參與使用。在接受《連線》雜誌採訪時,公司 CEO Rob Glaser 表示,他發起該項目的初衷,是為了解決學校安全和槍支管控的爭論。目前,Real Networks 網站正在大力宣傳該項技術,並稱即使臉被遮住,也可以讓活動主持人「認出每一位粉絲、客戶、員工或客人」。
Real Networks 並不是唯一一家專註於兒童面部識別產品的公司。德州一家初創公司 Waldo 正在向數百所學校、兒童體育聯盟和夏令營提供這項技術。在使用時,需要用 Waldo 的軟體掃描由攝像機或官方攝影師所拍攝的圖像,再將孩子的臉與父母所提供的圖像資料庫進行匹配,不想參加的家長可以選擇退出。
據該公司 CEO Rodney Rice 介紹,學校每年都會拍攝數萬張照片,其中只有少數幾張照片出現在年鑒上。他表示,人臉識別是一種有效的方式,可以把剩餘照片給那些想要的人。「不再需要購買爆米花什麼的了,直接把照片發給孩子的祖父母們當禮物。」Rice 解釋道。在這個過程中,Waldo 與公立學校的收入對半分成。該服務目前在美國三十多個州都有提供。
Waldo 和 FaceFirst 的發展表明,企業正在協助人臉識別的常規化。不久前,人臉識別還只是科幻小說中的內容。隨著技術擴散到美國經濟的更多領域,越來越多的公司將收集用戶的人臉數據,以用於訓練自己的演算法,或者識別客戶與罪犯——即使出錯或誤報的可能性也在增加。
你臉上的未來
2017 年,在科技反烏托邦電視劇《黑鏡》中,一位焦慮的母親因為女兒跟小混混在一起的照片而煩惱,為了確認男孩身份,她將對方臉孔照片上傳到用戶的人臉識別服務客戶端,軟體會立即顯示他的名字和工作地點,然後她就去找他了。
這樣的場景一度遙不可及,如今卻觸手可得。儘管人們對人臉識別的擔憂主要集中於政府的使用方式,但私人公司甚至個人的 「黑鏡式」 用法,也帶來了明顯的隱私風險。
隨著越來越多的公司開始銷售人臉識別技術,我們的面孔出現在越來越多的數據集中,偷窺者和跟蹤者可能也會利用相關軟體。商人和房東可以用這項技術識別不受歡迎的人,並悄悄停止服務提供。
美國公民自由聯盟的政策分析師 Jay Stanley 表示:「任何有攝像機的地方,有大量人流的地方,都可以編譯圖像資料庫,並使用分析軟體查看是否有數據匹配。」
還有黑客風險。網路安全公司 Gemini Advisors 的 Andrei Barysevich 表示,曾有印度國家生物識別資料庫的個人資料被盜,並在「暗網」(dark web)上出售。目前尚未有美國人臉資料庫出售,但這也只是時間問題。」 如果這種情況發生,從酒店或零售商那裡盜取的顧客臉孔可能會協助犯罪分子實施欺詐或身份盜竊犯罪。
隨著這項技術在幾乎完全沒有政府監管的情況下蓬勃發展,限制其濫用的最大希望可能在於軟體開發公司。在接受《財富》雜誌採訪時,人臉識別初創公司的 CEO 們都表示,他們非常關注隱私風險。包括 FaceFirst CEO 在內的許多人都將人臉監控系統在中國的普及作為一個警示。
他們還提出了兩種方法,限制行業濫用相關技術。第一種是與軟體購買者緊密合作,以確保客戶不會隨意使用軟體。例如,Ever AI 的 Aley 表示,Ever AI 所遵循的標準比亞馬遜更高。他聲稱亞馬遜為幾乎所有客戶都提供了 Rekognition 工具。
在回答如何監管濫用的問題時,亞馬遜提供了一份由 AWS 海外 AI 服務負責人 Matt Wood 此前發表的聲明。該聲明指出亞馬遜禁止非法或有害活動。不過,負責人臉識別的高管所提到的另一個潛在隱私保護措施,則是使用技術手段以確保資料庫中識別的人臉數據不會為黑客所竊。
Waldo 的 CEO Rice 表示,人臉數據以字母數字哈希( alphanumeric hashes)形式存儲。這意味著即使發生數據泄露,用戶隱私也不會受到損害,因為黑客無法使用哈希來重建人臉及其身份,這一點獲得其他人贊同。
Rice 還擔心,讓立法人員制定使用人臉識別技術的規則可能會弊大於利:「使用該技術的人,還要制定一系列該技術相應的規定,實在太滑稽了。」
與此同時,一些開發人臉識別軟體的公司正在使用新技術,可能會減少訓練演算法對大量人臉數據的需求。邁阿密的人臉識別初創公司 Kairos 就是這樣一個例子:Kairos 的客戶中有一家大型連鎖酒店,據其首席安全官 Stephen Moore 稱,Kairos 正在創造 「合成」 的面部數據,以複製各種表情和光照條件下的臉孔數據。他還表示,這些 「人造臉孔」 意味著公司可以在開發產品時使用更小規模的資料庫。
所有這些措施,無論是對人臉識別用戶的監管,完善數據安全,以及創造綜合培訓工具,都可以減輕人們對於這些公司在使用人臉數據時造成隱私問題的擔憂。與此同時,FaceFirst 的 Trepp 認為,隨著我們對這項技術熟悉程度的增加,對其擔憂也會減少。他甚至表示,2002 年科幻電影 Minority Report 中的人臉識別場景將會尋常起來。「千禧一代更願意提供自己的臉孔數據,屬於 Minority Report 的世界即將到來。如果處理得當,我認為人們會喜歡的,這將是一項積極的體驗,而不會讓人毛骨悚然。」
包括美國公民自由聯盟(ACLU)在內的其他組織則沒那麼樂觀。不過,儘管圍繞這項技術的爭議越來越大,但目前幾乎沒有任何法律限制其使用,唯一例外來自三個州:伊利諾斯州、德克薩斯州和華盛頓州,在使用人臉數據前需要一定程度的同意。相關法律並沒有經過真正的檢驗,唯一例外是伊利諾斯州,該州的消費者可以提起訴訟來執行這項權利。
目前,伊利諾斯州的法律也是一個涉及 Facebook 的上訴法院案件主題,該案件聲稱對人臉數據獲取的限制並不包含數字掃描。2017 年,Facebook 和谷歌進行了一次遊說,試圖說服伊利諾伊州議員降低這條法律的影響,結果失敗了。今年 1 月底,據伊利諾伊州最高法院裁定,如果消費者想就未經許可使用生物識別特徵的技術提起訴訟,無需出示在真實世界受到傷害的證明便可提起。這進一步鼓勵了這項法律的支持者。
其他州也在考慮制定生物識別方面的法律。在聯邦一級,目前議員們對此事關注甚少。然而,隨著參議員 Brian Schatz(民主黨) and Roy Blount(共和黨)在 3 月份所提出的一項法案,要求科技公司在公共場所使用人臉識別技術前,或者與第三方共享人臉數據前必須獲得許可,這種情況可能正在改變。
喬治城大學的研究人員 Garvie 贊成通過法律監督這項技術,但她表示,立法者一直很難跟上技術發展的腳步。「人臉識別所面臨的一個挑戰在於,由於傳統資料庫的存在,其普及速度非常快。人們的面孔數據極其容易被採集,長期以來,針對指紋的採集方式和時間都有限制,但人臉識別技術則沒有限制。」
TAG:AI科技大本營 |