用AI檢測女性「前科」，「原諒寶」就是「科技向善」的反面

科技 06-02

圖片來源@視覺中國

文 | 航通社，作者 | 書航

2017 年，程序員蘇享茂因遭遇前妻翟欣欣「騙婚」索要1000萬元和房產賠償而自殺，引發了社會對」老實人「程序員」接盤「的關注和調侃。

最近，有人號稱開發出了檢測「小姐姐」的 AI 產品，聲稱是為了「解救」程序員群體，最終卻頂不住輿論壓力以「刪庫跑路」告終。

這樣的產品，一旦真的做出來併流行開去，會帶來怎樣的社會影響？假設它真的有效，你會用它和相信它嗎？

它是什麼

5 月 27 日，微博用戶@將記憶深埋表示，他完成了在半年前開始準備的一個項目：將色情網站上的公開視頻和圖片打標籤後做匹配，以實現所謂「以圖搜片」，查詢者可以通過上傳女性照片、視頻和資料庫做匹配，判斷該女性是否疑似從事過色情行業。

他表示，已經「在全球範圍內成功識別了 10 多萬名疑似從事色情行業的女性」，同時，可以對美顏、Deepfakes 換臉等有效對抗，識別率達到 99%；而對於聲音語氣模仿採用聲紋檢測對抗，識別率達到 100%。

不過，他只是自己宣稱而已，並且他以害怕違法為由，拒絕開放 API 或查詢頁面，也不公布論文或開源演算法，而是打算做成一個商業產品。有熱心網友替他想好了產品的名字：「原諒寶」。

微博下面一片罵聲。激烈反對的以女性居多，相反堅定的支持者多為男性。支持者們認為，在微博下反對的女性反而是」自投羅網「；甚至據傳，有一位反對者的微博被」挖墳「，發現了所謂」黑歷史「。這就意味著，即使是發個帖說下反對意見，也必須做好萬全的準備，確保萬無一失才行。

5 月 31 日，本來說要直播接受媒體採訪的作者取消了原計劃，同時刪除了整個項目和資料庫，因言論給他人造成不便而道歉告終。只是對這個項目的討論並沒有隨著作者」刪庫跑路「而終結。

正如劉慈欣在科幻小說《鏡子》中說的那樣，即使某一個人有了驚人發現後秘而不宣，地球上一定會有同時想到同一個點子的其它人率先打破沉默，公開同樣的成果。[1]

它可能有私心

令人疑惑的是，作者宣布這是一個商業化的軟體，即使他自稱將把維持伺服器開銷後的其他收入，用來捐助所謂的防治艾滋病基金。

然而，他並沒有選擇最穩妥，也最可靠的方法以獲得潛在使用者的信任——也就是將整個技術和背後所用的素材庫開源。沒有開源，代碼便不能接受監督，而外部人士也完全有理由來懷疑它是「暗箱操作」。

例如，產品正常判斷出結果之後，有可能被植入一些特定人的特定信息，做所謂「人為矯正」。這就意味著即使其數據源網站中並不存在的片段，也有可能會出現在原諒寶的結果當中。

反過來，也有一些人可能已經識別到，但是假設這人交一些錢，或者採用一些手段，就可以讓」原諒寶「不顯示這個識別結果，相當於是買了 VIP 會員就「隱身」。

如果不是完全開源以證清白的話，沒有辦法證明作者能抵擋得住這樣的誘惑。

有人說，市場上也有對男版「原諒寶」的強烈需求。問題在於，要找出所謂」渣男「的證據，露臉的圖片或視頻遠遠比不上之前傳出泄露的開房記錄有效。

在眾多「資源」中，男性的臉和身材並不是觀眾「欣賞」的主要對象，男主不出現都沒關係，更準確的說是不希望他出現，有很多片子是所謂的第一人稱視角。這就會使男性在片中曝光的可能性遠遠小於女性。

更不用說，這其中有一些片段，其實是此前所謂「裸貸」、「裸條」的產物。其中的女性是被逼迫拍攝的，並非本人自願，當然就更不可能有男性出場。因此，男性的數據集要遠遠少於女性，如果要做「男版原諒寶」的話，準確率也會更低。

但是女性的需求卻是真實存在的。《穀雨》的特稿描寫了香港的「私家偵探社」，他們就像是「民間的警察」，幫助客戶解決警察無法處理的隱形問題。他們經手的多是商業調查和家庭糾紛，後者包括調查子女吸毒援交、配偶婚外情等。[2]

與這些真實而迫切的需求相比，僅通過「小姐姐」單點突破的」原諒寶「，其產品設計上不可言傳的曖昧就非常明顯了。

它不能確保萬無一失

即便「原諒寶」用某種方法證明了自身的中立和非歧視，但仍有或許不可逾越的技術門檻。

人臉識別可能在某些地方已經比較精準，但在缺乏一個準確的資料庫的前提下，「冷啟動」的準確率仍然不高，這是一個即使連谷歌或百度這樣的技術巨頭都尚且無法解決的問題。

現在，蘋果 [3] 和谷歌 [4] 都在各自的操作系統中，準備把現有的 AI 演算法從網路調用變成本地運算，將整個包壓縮到手機能承載的範圍之內，搭載最新的 AI 晶元，以便將一些在線運算轉為本地運算，以充分保護用戶的隱私。

即便如此，這也並不意味著經過少數訓練，甚至基本沒有訓練過的某張隨意給定的照片，都能得到很高的準確率。

「原諒寶」聲稱使用的都是公開資源，一些早已出名的「下海」人士的面孔當然是清晰的，但是識別出來也沒有太大意義。至於所謂「素人」，要麼臉部有遮擋，要麼來自偷拍，導致圖像晃動或質量不佳，發生誤判的幾率非常高。[5]

而且，即使是給定的幾個網路社區，也不能說其上傳的所有內容都是所謂「自願」的。由分手後有意報復的一方上傳的「復仇色情」（Revenge Porn）或者 Deepfakes 等製造的「換臉視頻」，都沒有 100% 保險的區分辦法。

」原諒寶「作者目前為止披露的技術手段，跟外界預測的沒有太大區別，所以他所講的準確率也不讓人信服。

它助長傳謠，不能闢謠

「原諒寶」的出現還可能促成不準確的結果大舉流傳，演變為謠言的傳播，給可能無辜的當事人帶來不可挽回的傷害。

「原諒寶」如何建立自身可信度，以及攻克技術難關都尚且存疑，不過有很多評論者已經決定信以為真。具體使用者不一定能準確的認識到查詢結果的模糊性，並在使用時留一個心眼。

一部分原因是，之前出現過有些違規使用戶籍查詢系統來做「人肉搜索」的情形。由於戶籍不靠演算法，可以認為是 100% 準確的，只需要考證截屏是否為偽造；而圖象真偽，往往又是由所謂」線人「的人格做擔保的，可以尋根溯源。這使得人們習慣了相對」精準「的人肉搜索結果。但是，如果也用同樣的眼光來看待」原諒寶「生成的，準確度只有一定概率的結果，就非常容易產生誤判。

誤判之後，能否糾正呢？太困難了。像是最近有一個謠言說華為跟阿聯酋簽署了 5G 協議，阿聯酋為答謝華為在迪拜塔開展燈光秀。這個傳聞已經連續兩三天出現在我的朋友圈和群聊當中，即使是一些本身就從事傳媒行業的朋友也會轉發過來。

實際上，阿聯酋與華為簽署 5G 協議是今年 2 月初的 [6] ；迪拜哈里發塔亮燈發生在去年 10 月 Mate 20 [7] 和今年 4 月 P30 的中東發布會 [8] 期間。但是，在已經廣泛闢謠後，此消息仍在流傳的現實，再次證明了「造謠一張嘴，闢謠跑斷腿」的道理。

所以，我們並不能指望萬一「原諒寶」發生誤判之後，就能突然以良好的機制來防止謠言擴散和闢謠。倒不如說，由於「原諒寶」所引發的謠言傳播，幾乎在這個產品公布出來的那一刻，就是註定了的。

它本質上是」人肉搜索「

「原諒寶」所採用的原始數據，以公開狀態在網上放了很長時間，並沒有掀起什麼風浪。然而，這是因為這些數據是打散的，並且沒有形成一個系統的鏈條。

如果「原諒寶」真的如其作者所聲稱的一般，可以通過極其簡易的方法，實現對數據的梳理和總結，使得普通人利用這些信息成為可能，這些信息就從幾乎等於不存在一樣，轉變為對當事人真實可見的威脅。

即使並非「開房」這樣敏感的數據，只是一個人普通的人生軌跡，形成完整的鏈條之後，後果都可以相當嚴重。微博名人和菜頭曾經提出，微博可以幫助人販子得知博主及孩子的各種詳細線索。有位女網友不相信，和菜頭就把她的 700 多條微博翻了個遍，並出具了一份含有她所在城市、工作單位地址、孩子的姓名、生日、常去的地方以及家庭結構等的分析報告。[9]

歷史上，QQ [10] 、支付寶 [11] 和抖音[12] 都遇到使用者投訴，說利用通訊錄、演算法等分析得出的「你可能認識的人」推送功能，向其推送了並不願意再聯繫的前男友或前女友。即使是這樣完全不涉及敏感信息的功能都能遭到爭議，那麼像「原諒寶」所涉及的領域，如果不遭到更大的非議，反而就很奇怪了。

很多人在匿名狀態下，失去了社會身份的約束，容易激發出人性中黑暗的一面。對於涉及別人的隱私，大家都很願意窺探，有窺私心理，而如果是涉及到自己的隱私泄露出去，則一定要堅決反對。

不知是受到先天的影響，還是後天的規訓，不同的性別也體現出不同的立場。對自身隱私和安全滿不在乎，又有強烈的窺私慾望的，男性居多；反過來，既對別人的歷史和隱私不感興趣，又強烈的在意自己的隱私被曝光的，女性居多。

但有趣的是，經常到別人的微博底下挖墳扒黑歷史的，男女都有，特別是在一些觸及粉絲「逆鱗」的地方，女性尤甚。[13]

其實，這種因窺私而穿透別人隱藏於互聯網各個角落的個人信息，並將其串聯起來的行為，正好就是上文說到的「原諒寶」的作用——將打散的數據整合為證據鏈條，梳理出一個人的數字足跡，帶來了極大的社會隱患和人人自危的不安全感。

它的初衷，有更好的方式去實現

作者說，「原諒寶」開發的初衷是為了避免程序員陷入所謂的「女神」陷阱。然而，如果只是想讓程序員不做」接盤俠「，想讓他們找到品行端正的另一半，就只有這一條路可走？

除了這種反向識別出「小姐姐」的方式之外，明明還是有可以正向識別的方式的。為什麼人工智慧不能通過一些選擇項，讓一些默默無聞，藏於深閨，但又渴望真實愛情的好女孩，在人群當中脫穎而出呢？

「母胎單身」絕不可能是男性獨有的問題，特別是當城市裡其實湧入了不少出身農村，但不願回去的女孩的情況下，總是會出現單身男女相互不匹配的「結構性資源短缺」。

在知乎的情感問題區，有很多類似「如何讓一個男生喜歡上你」的由女性提出的問題。中國孩子在成長階段，一般都被」禁止早戀「的家長粗暴剝奪了自學戀愛技能的機會，一到上大學或畢業，又被趕鴨子上架要求解決對象問題。這樣培養出的，當然有兩耳不聞窗外事的男碼農，但誰說這樣就不能產出覺得戀愛是羞恥的，釋放女性魅力是「放蕩」的，從而過度封閉自我，不為人注意的女孩呢？[14]

那麼，如果這樣的女孩能夠找到一個同樣老實，不會背叛的，又顧家，又上進的程序員，這實際不也是」天作之合「嗎？這樣的信息，是否能夠通過一個正向的所謂「戀愛寶」這樣的東西來匹配呢？為什麼作者不能從這個方向去想？

退一步講，即使是從避免「感情騙子」的角度講，也完全可以做一些更為基礎性的工作。

以翟欣欣為例，有人評價她的對外檔案十分符合所謂「好嫁風」的描述：長得漂亮，但是穿得很保守，看起來土土的；家世好，家裡有點錢，好大學畢業，有不錯的工作 [15]。但事發後，她被曝光資料作假，曾有婚史。

這種信息很大概率不會出現在「原諒寶」的數據集當中，但它實際上是「碼農」們更需要的。都說區塊鏈追根溯源能解決差不多一切問題，能用區塊鏈或者大數據揪出婚戀網站的公開資料造假嗎？這不是比充滿了性暗示的「原諒寶」更有用？

小時候，我讀到一個故事，但現在已很難找到。故事說，一個優秀的銀行驗鈔員被問到有什麼檢驗的技巧時說，自己也不知道有什麼竅門，只是接觸紙幣時間長了，能感覺到假幣的手感不像是真的。

後來，我找到一個媒體報道，說某地發現的拼接假幣，驗鈔機無法識別，是櫃檯服務人員手工點鈔時發現的。[16]

這種「無他，唯手熟爾」的故事說明，解決同樣一個問題，我們可以用反向的「堵」，用預設他人不可信任的方法，也可以用正向的「疏」，用給社會造成更小分歧與創傷的手段。

在我看來，現在很流行的概念「科技向善」不需要企業一定得做慈善，而是在面臨這樣的抉擇的時候，去選擇那些彌合分歧，而不是撕裂分歧的辦法，用保護他人，而不是傷害他人的辦法，用雙贏，而不是零和遊戲的辦法，這樣就已經是最大的「善」了。

而「原諒寶」這個產品體現出的，就是「科技向善」的反面。

[1] http://www.kehuan.net.cn/book/jingzi/14.html

[4] https://www.leiphone.com/news/201905/ArmUEPJXPEx00fuZ.html

[5] https://www.zhihu.com/question/326781498/answer/699600752

[6] https://news.sina.com.cn/c/2019-02-27/doc-ihsxncvf8136019.shtml

[7] https://www.weibo.com/3032210184/GFyC2nATV

[8] https://www.weibo.com/3032210184/HnN6OleI5

[10] https://www.geekpark.net/news/155595

[11] https://news.mydrivers.com/1/495/495337.htm

[12] https://news.mydrivers.com/1/619/619833.htm

[14] https://www.zhihu.com/question/267027873/answer/599314321

[15] https://baijiahao.baidu.com/s?id=1601606367980732550

[16] http://www.dffyw.com/fayanguancha/sh/200901/20090117195040.htm

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 鈦媒體APP 的精彩文章:

※台積電：掌握華為晶元命運的台灣晶圓代工巨頭
※研究證明，iPhone也會「偷竊」用戶數據

TAG:鈦媒體APP |