微軟刪除全球最大公開面部識別資料庫MS Celeb,包含1000萬張人臉
【新智元導讀】據英國《金融時報》報道,微軟從互聯網上悄悄刪除了MS Celeb資料庫,該數庫包含超過1000萬張大約10萬人的圖像,報道稱該資料庫原為學術用途,但已被商業機構所用,而微軟不能控制商業使用的目的。
早在2016年,微軟就建立了一個擁有超過1000萬張圖像的資料庫,其中大約有10萬人。近日,據英國《金融時報》報道,微軟從互聯網上悄悄刪除了這個名為MS Celeb的資料庫。
該資料庫最初於2016年發布,被微軟描述為世界上最大的公開面部識別資料庫,並用於培訓全球科技公司和軍事研究人員的面部識別系統。
據稱,它被稱為「Celeb」,意味著資料庫中的面孔來自公眾人物。但據英國《金融時報》報道,資料庫中的許多人並沒有授權這一行為。相反,他們的圖像是通過「知識共享」(Creative Commons )許可證來抓取圖像和視頻搜索的。(根據許可證,你可以將照片重新用於學術研究。照片中的人物並不一定授權許可,而是版權所有者授權。)
「這個網站是用於學術用途,」微軟對《金融時報》說:「它是由一位已經不在Microsoft工作的員工運行的,並且已被刪除。」
真能徹底刪除嗎?
然而,由柏林的研究員Adam Harvey發現的MS Celeb,也包含了所謂的「可以說是私人」的圖像,如安全記者和作者。Adam Harvey負責管理名為Megapixels的項目,這個項目揭露了有關此類資料庫的詳細信息。
在接受採訪時,Adam還表示即使MS Celeb已被刪除,其內容仍在網路上共享。「你不能讓資料庫消失。一旦你發布它,人們下載它,它就存在於全世界的硬碟上,」他說。
不幸的是,事情並不那麼簡單。MS Celeb已被多家公司使用,包括IBM、松下、英偉達和日立等。
微軟本身一直在公開反對將這種技術作為政府監督的一種形式。在2018年12月的一篇博客中,微軟呼籲各公司建立保障措施,並要求政府開始規範面部識別技術。4月早些時候,據報道,微軟還拒絕了加利福尼亞州一家執法機構的要求,要求在警車和身體攝像頭上安裝面部識別技術,因為這樣做會對婦女和少數群體造成不相稱的影響。
然而,微軟的反對和良好的意圖僅僅到此為止。《金融時報》指出,任何之前下載過該數據的學術機構或公司仍然可以使用MS Celeb資料庫,並且該資料庫仍在GitHub, Dropbox和百度雲上共享。Gizmodo聯繫微軟徵求意見,但沒有立即收到回復。
參考鏈接:
https://gizmodo.com/microsoft-quietly-pulls-its-database-of-100-000-faces-u-1835296212
https://www.engadget.com/2019/06/06/microsoft-discreetly-wiped-its-massive-facial-recognition-databa
※周志華推薦 | 李沐《動手學深度學習》中文版上線
※7大中國高科技被BBC評為世界之最,華為5G名列榜首!
TAG:新智元 |