涉嫌侵犯隱私,IBM未經許可將用戶照片用於AI訓練
你的照片還好嗎?
當面部識別成為越來越廣泛應用的技術,隨之而來的是關於個人數據隱私泄露的擔憂。IBM這次就撞在了槍口上。近日,外媒報道曝光IBM未經許可,利用網路相冊Flickr上近100萬張個人照片,訓練它們面部識別系統,同時與外部研究人員共享這些照片。
眾所周知,機器學習的關鍵就是大量的數據訓練,人臉識別演算法亦然。為了提高演算法的精確度,需要標註上百萬的照片來訓練AI。
據了解,在Flickr上傳照片的用戶並不同意IBM將其照片用於開發面部識別系統,因為這些可能最終會被用來監視和識別他們。一位攝影師透露:「我拍攝的人中沒有一個人知道他們的照片是以這種方式使用的。」
這些照片被IBM統稱之為訓練數據集,他們已經對照片上人物的膚色、性別、面部輪廓等做了詳細的標註。
儘管IBM保證Flickr用戶可以選擇退出資料庫,但報道該事件的媒體NBC新聞發現,刪除照片幾乎是不可能的。IBM要求攝影師通過電子郵件發送他們想要刪除的照片的鏈接,但該公司尚未公開分享數據集中包含的Flickr用戶和照片列表,因此沒有簡單的方法可以找到包含哪些照片。
這幾年隨著面部識別的大規模應用,不少科技公司都和IBM一樣,抓取網路上公開、非商業性質的圖片、視頻來訓練AI程序。
此次被曝光的IBM數據訓練集就是YFCC100M照片庫的一部分,YFCC100M是Flickr前東家雅虎為進行研究而收集的照片資料庫。所有照片都是在CreativeCommonsLicense版權協議下共享的,這種版權協議表明照片可以自由使用,但存在一些限制。
面對質疑,IBM表示數據集不會將人臉的照片與其姓名相關聯,而且他們的目標是為了解決演算法的偏差,以防可能出現的種族歧視。但是,公民自由倡導者和技術倫理研究人員仍然質疑IBM的動機,因為IBM也在銷售人臉識別系統,這些工具因侵犯公民自由一直受到批評。
有業內人士指出,IBM和Facebook等公司的研究機構和商業運營之間的區別是模糊的。即使演算法由學術研究人員使用非商業數據集開發,它們通常也會被企業使用。
更多優質內容,請持續關注鎂客網~~
※科創板規則深夜正式落地;加拿大批准繼續推進孟晚舟引渡聽證會
※馬斯克稱特斯拉將在今年年底實現完全自動駕駛;李斌發內部信回應「柴油加電」
TAG:鎂客網 |