用AI檢測女性「前科」,「原諒寶」就是「科技向善」的反面
圖片來源@視覺中國
文 | 航通社,作者 | 書航
2017 年,程序員蘇享茂因遭遇前妻翟欣欣「騙婚」索要1000萬元和房產賠償而自殺,引發了社會對」老實人「程序員」接盤「的關注和調侃。
最近,有人號稱開發出了檢測「小姐姐」的 AI 產品,聲稱是為了「解救」程序員群體,最終卻頂不住輿論壓力以「刪庫跑路」告終。
這樣的產品,一旦真的做出來併流行開去,會帶來怎樣的社會影響?假設它真的有效,你會用它和相信它嗎?
它是什麼
5 月 27 日,微博用戶@將記憶深埋 表示,他完成了在半年前開始準備的一個項目:將色情網站上的公開視頻和圖片打標籤後做匹配,以實現所謂「以圖搜片」,查詢者可以通過上傳女性照片、視頻和資料庫做匹配,判斷該女性是否疑似從事過色情行業。
他表示,已經「在全球範圍內成功識別了 10 多萬名疑似從事色情行業的女性」,同時,可以對美顏、Deepfakes 換臉等有效對抗,識別率達到 99%;而對於聲音語氣模仿採用聲紋檢測對抗,識別率達到 100%。
不過,他只是自己宣稱而已,並且他以害怕違法為由,拒絕開放 API 或查詢頁面,也不公布論文或開源演算法,而是打算做成一個商業產品。有熱心網友替他想好了產品的名字:「原諒寶」。
微博下面一片罵聲。激烈反對的以女性居多,相反堅定的支持者多為男性。支持者們認為,在微博下反對的女性反而是」自投羅網「;甚至據傳,有一位反對者的微博被」挖墳「,發現了所謂」黑歷史「。這就意味著,即使是發個帖說下反對意見,也必須做好萬全的準備,確保萬無一失才行。
5 月 31 日,本來說要直播接受媒體採訪的作者取消了原計劃,同時刪除了整個項目和資料庫,因言論給他人造成不便而道歉告終。只是對這個項目的討論並沒有隨著作者」刪庫跑路「而終結。
正如劉慈欣在科幻小說《鏡子》中說的那樣,即使某一個人有了驚人發現後秘而不宣,地球上一定會有同時想到同一個點子的其它人率先打破沉默,公開同樣的成果。[1]
它可能有私心
令人疑惑的是,作者宣布這是一個商業化的軟體,即使他自稱將把維持伺服器開銷後的其他收入,用來捐助所謂的防治艾滋病基金。
然而,他並沒有選擇最穩妥,也最可靠的方法以獲得潛在使用者的信任——也就是將整個技術和背後所用的素材庫開源。沒有開源,代碼便不能接受監督,而外部人士也完全有理由來懷疑它是「暗箱操作」。
例如,產品正常判斷出結果之後,有可能被植入一些特定人的特定信息,做所謂「人為矯正」。這就意味著即使其數據源網站中並不存在的片段,也有可能會出現在原諒寶的結果當中。
反過來,也有一些人可能已經識別到,但是假設這人交一些錢,或者採用一些手段,就可以讓」原諒寶「不顯示這個識別結果,相當於是買了 VIP 會員就「隱身」。
如果不是完全開源以證清白的話,沒有辦法證明作者能抵擋得住這樣的誘惑。
有人說,市場上也有對男版「原諒寶」的強烈需求。問題在於,要找出所謂」渣男「的證據,露臉的圖片或視頻遠遠比不上之前傳出泄露的開房記錄有效。
在眾多「資源」中,男性的臉和身材並不是觀眾「欣賞」的主要對象,男主不出現都沒關係,更準確的說是不希望他出現,有很多片子是所謂的第一人稱視角。這就會使男性在片中曝光的可能性遠遠小於女性。
更不用說,這其中有一些片段,其實是此前所謂「裸貸」、「裸條」的產物。其中的女性是被逼迫拍攝的,並非本人自願,當然就更不可能有男性出場。因此,男性的數據集要遠遠少於女性,如果要做「男版原諒寶」的話,準確率也會更低。
但是女性的需求卻是真實存在的。《穀雨》的特稿描寫了香港的「私家偵探社」,他們就像是「民間的警察」,幫助客戶解決警察無法處理的隱形問題。他們經手的多是商業調查和家庭糾紛,後者包括調查子女吸毒援交、配偶婚外情等。[2]
與這些真實而迫切的需求相比,僅通過「小姐姐」單點突破的」原諒寶「,其產品設計上不可言傳的曖昧就非常明顯了。
它不能確保萬無一失
即便「原諒寶」用某種方法證明了自身的中立和非歧視,但仍有或許不可逾越的技術門檻。
人臉識別可能在某些地方已經比較精準,但在缺乏一個準確的資料庫的前提下,「冷啟動」的準確率仍然不高,這是一個即使連谷歌或百度這樣的技術巨頭都尚且無法解決的問題。
現在,蘋果 [3] 和谷歌 [4] 都在各自的操作系統中,準備把現有的 AI 演算法從網路調用變成本地運算,將整個包壓縮到手機能承載的範圍之內,搭載最新的 AI 晶元,以便將一些在線運算轉為本地運算,以充分保護用戶的隱私。
即便如此,這也並不意味著經過少數訓練,甚至基本沒有訓練過的某張隨意給定的照片,都能得到很高的準確率。
「原諒寶」聲稱使用的都是公開資源,一些早已出名的「下海」人士的面孔當然是清晰的,但是識別出來也沒有太大意義。至於所謂「素人」,要麼臉部有遮擋,要麼來自偷拍,導致圖像晃動或質量不佳,發生誤判的幾率非常高。[5]
而且,即使是給定的幾個網路社區,也不能說其上傳的所有內容都是所謂「自願」的。由分手後有意報復的一方上傳的「復仇色情」(Revenge Porn)或者 Deepfakes 等製造的「換臉視頻」,都沒有 100% 保險的區分辦法。
」原諒寶「作者目前為止披露的技術手段,跟外界預測的沒有太大區別,所以他所講的準確率也不讓人信服。
它助長傳謠,不能闢謠
「原諒寶」的出現還可能促成不準確的結果大舉流傳,演變為謠言的傳播,給可能無辜的當事人帶來不可挽回的傷害。
「原諒寶」如何建立自身可信度,以及攻克技術難關都尚且存疑,不過有很多評論者已經決定信以為真。具體使用者不一定能準確的認識到查詢結果的模糊性,並在使用時留一個心眼。
一部分原因是,之前出現過有些違規使用戶籍查詢系統來做「人肉搜索」的情形。由於戶籍不靠演算法,可以認為是 100% 準確的,只需要考證截屏是否為偽造;而圖象真偽,往往又是由所謂」線人「的人格做擔保的,可以尋根溯源。這使得人們習慣了相對」精準「的人肉搜索結果。但是,如果也用同樣的眼光來看待」原諒寶「生成的,準確度只有一定概率的結果,就非常容易產生誤判。
誤判之後,能否糾正呢?太困難了。像是最近有一個謠言說華為跟阿聯酋簽署了 5G 協議,阿聯酋為答謝華為在迪拜塔開展燈光秀。這個傳聞已經連續兩三天出現在我的朋友圈和群聊當中,即使是一些本身就從事傳媒行業的朋友也會轉發過來。
實際上,阿聯酋與華為簽署 5G 協議是今年 2 月初的 [6] ;迪拜哈里發塔亮燈發生在去年 10 月 Mate 20 [7] 和今年 4 月 P30 的中東發布會 [8] 期間。但是,在已經廣泛闢謠後,此消息仍在流傳的現實,再次證明了「造謠一張嘴,闢謠跑斷腿」的道理。
所以,我們並不能指望萬一「原諒寶」發生誤判之後,就能突然以良好的機制來防止謠言擴散和闢謠。倒不如說,由於「原諒寶」所引發的謠言傳播,幾乎在這個產品公布出來的那一刻,就是註定了的。
它本質上是」人肉搜索「
「原諒寶」所採用的原始數據,以公開狀態在網上放了很長時間,並沒有掀起什麼風浪。然而,這是因為這些數據是打散的,並且沒有形成一個系統的鏈條。
如果「原諒寶」真的如其作者所聲稱的一般,可以通過極其簡易的方法,實現對數據的梳理和總結,使得普通人利用這些信息成為可能,這些信息就從幾乎等於不存在一樣,轉變為對當事人真實可見的威脅。
即使並非「開房」這樣敏感的數據,只是一個人普通的人生軌跡,形成完整的鏈條之後,後果都可以相當嚴重。微博名人和菜頭曾經提出,微博可以幫助人販子得知博主及孩子的各種詳細線索。有位女網友不相信,和菜頭就把她的 700 多條微博翻了個遍,並出具了一份含有她所在城市、工作單位地址、孩子的姓名、生日、常去的地方以及家庭結構等的分析報告。[9]
歷史上,QQ [10] 、支付寶 [11] 和抖音[12] 都遇到使用者投訴,說利用通訊錄、演算法等分析得出的「你可能認識的人」推送功能,向其推送了並不願意再聯繫的前男友或前女友。即使是這樣完全不涉及敏感信息的功能都能遭到爭議,那麼像「原諒寶」所涉及的領域,如果不遭到更大的非議,反而就很奇怪了。
很多人在匿名狀態下,失去了社會身份的約束,容易激發出人性中黑暗的一面。對於涉及別人的隱私,大家都很願意窺探,有窺私心理,而如果是涉及到自己的隱私泄露出去,則一定要堅決反對。
不知是受到先天的影響,還是後天的規訓,不同的性別也體現出不同的立場。對自身隱私和安全滿不在乎,又有強烈的窺私慾望的,男性居多;反過來,既對別人的歷史和隱私不感興趣,又強烈的在意自己的隱私被曝光的,女性居多。
但有趣的是,經常到別人的微博底下挖墳扒黑歷史的,男女都有,特別是在一些觸及粉絲「逆鱗」的地方,女性尤甚。[13]
其實,這種因窺私而穿透別人隱藏於互聯網各個角落的個人信息,並將其串聯起來的行為,正好就是上文說到的「原諒寶」的作用——將打散的數據整合為證據鏈條,梳理出一個人的數字足跡,帶來了極大的社會隱患和人人自危的不安全感。
它的初衷,有更好的方式去實現
作者說,「原諒寶」開發的初衷是為了避免程序員陷入所謂的「女神」陷阱。然而,如果只是想讓程序員不做」接盤俠「,想讓他們找到品行端正的另一半,就只有這一條路可走?
除了這種反向識別出「小姐姐」的方式之外,明明還是有可以正向識別的方式的。為什麼人工智慧不能通過一些選擇項,讓一些默默無聞,藏於深閨,但又渴望真實愛情的好女孩,在人群當中脫穎而出呢?
「母胎單身」絕不可能是男性獨有的問題,特別是當城市裡其實湧入了不少出身農村,但不願回去的女孩的情況下,總是會出現單身男女相互不匹配的「結構性資源短缺」。
在知乎的情感問題區,有很多類似「如何讓一個男生喜歡上你」的由女性提出的問題。中國孩子在成長階段,一般都被」禁止早戀「的家長粗暴剝奪了自學戀愛技能的機會,一到上大學或畢業,又被趕鴨子上架要求解決對象問題。這樣培養出的,當然有兩耳不聞窗外事的男碼農,但誰說這樣就不能產出覺得戀愛是羞恥的,釋放女性魅力是「放蕩」的,從而過度封閉自我,不為人注意的女孩呢?[14]
那麼,如果這樣的女孩能夠找到一個同樣老實,不會背叛的,又顧家,又上進的程序員,這實際不也是」天作之合「嗎?這樣的信息,是否能夠通過一個正向的所謂「戀愛寶」這樣的東西來匹配呢?為什麼作者不能從這個方向去想?
退一步講,即使是從避免「感情騙子」的角度講,也完全可以做一些更為基礎性的工作。
以翟欣欣為例,有人評價她的對外檔案十分符合所謂「好嫁風」的描述:長得漂亮,但是穿得很保守,看起來土土的;家世好,家裡有點錢,好大學畢業,有不錯的工作 [15]。但事發後,她被曝光資料作假,曾有婚史。
這種信息很大概率不會出現在「原諒寶」的數據集當中,但它實際上是「碼農」們更需要的。都說區塊鏈追根溯源能解決差不多一切問題,能用區塊鏈或者大數據揪出婚戀網站的公開資料造假嗎?這不是比充滿了性暗示的「原諒寶」更有用?
小時候,我讀到一個故事,但現在已很難找到。故事說,一個優秀的銀行驗鈔員被問到有什麼檢驗的技巧時說,自己也不知道有什麼竅門,只是接觸紙幣時間長了,能感覺到假幣的手感不像是真的。
後來,我找到一個媒體報道,說某地發現的拼接假幣,驗鈔機無法識別,是櫃檯服務人員手工點鈔時發現的。[16]
這種「無他,唯手熟爾」的故事說明,解決同樣一個問題,我們可以用反向的「堵」,用預設他人不可信任的方法,也可以用正向的「疏」,用給社會造成更小分歧與創傷的手段。
在我看來,現在很流行的概念「科技向善」不需要企業一定得做慈善,而是在面臨這樣的抉擇的時候,去選擇那些彌合分歧,而不是撕裂分歧的辦法,用保護他人,而不是傷害他人的辦法,用雙贏,而不是零和遊戲的辦法,這樣就已經是最大的「善」了。
而「原諒寶」這個產品體現出的,就是「科技向善」的反面。
[1] http://www.kehuan.net.cn/book/jingzi/14.html
[4] https://www.leiphone.com/news/201905/ArmUEPJXPEx00fuZ.html
[5] https://www.zhihu.com/question/326781498/answer/699600752
[6] https://news.sina.com.cn/c/2019-02-27/doc-ihsxncvf8136019.shtml
[7] https://www.weibo.com/3032210184/GFyC2nATV
[8] https://www.weibo.com/3032210184/HnN6OleI5
[10] https://www.geekpark.net/news/155595
[11] https://news.mydrivers.com/1/495/495337.htm
[12] https://news.mydrivers.com/1/619/619833.htm
[14] https://www.zhihu.com/question/267027873/answer/599314321
[15] https://baijiahao.baidu.com/s?id=1601606367980732550
[16] http://www.dffyw.com/fayanguancha/sh/200901/20090117195040.htm
※台積電:掌握華為晶元命運的台灣晶圓代工巨頭
※研究證明,iPhone也會「偷竊」用戶數據
TAG:鈦媒體APP |