當前位置:
首頁 > 天下 > 人臉分析:一門「新玄學」

人臉分析:一門「新玄學」

原標題:人臉分析:一門「新玄學」



作者:塗子沛,著名大數據專家,阿里巴巴集團前副總裁,著有《大數據》《數據之巔》《數文明》數據三步曲。作者授權虎嗅獨家首發此文。


在難得的飯後閑余,我偶爾也關注一些娛樂新聞。我注意到,最近國內外公眾人物的「人設崩塌」頻率堪比Facebook的數據泄露。


誰能想到素來以穩重成熟形象示人的「大叔」吳秀波,私情會如此泛濫;眉清目秀的張雨綺,「暴力傾向」似乎就沒收斂過;外形俊朗、才華橫溢的《銀河護衛隊》導演詹姆斯·古恩,竟有戀童癖好,最終被迪士尼開除。

「看臉」的時代,百年名校也未能倖免。近日,網上爆出南開大學進行了一項關於銀行行長面部寬高比(fWHR)的研究,結果發現,行長的面部寬高比影響銀行績效,臉越寬的行長,銀行績效越好。



這篇文章的截圖在諸多微信群里引起了群嘲式的討論。如果這真是科學,那未來銀行行長的選拔和招聘,是不是要首先量一量臉?大數據分析跟民間的看相算命之術又有什麼分別?大數據時代的人臉分析,是不是已經成為一種玄學?


我不禁想起中國古人的一句話:「知人知面不知心」。很多時候,就算是一些低頭不見抬頭見的身邊人,恐怕我們也不敢說真正了解。


我想,現代人臉識別技術十分精湛,攝像頭布局在城市的各個角落,還有無數「有意」「無意」時時刻刻在記錄的個體化工具,從面到面的精確識別,包括表情分析等技術正在改變和約束我們的日常行為,如果真的能夠通過人的面部特徵和表情分析,去撕開極具偽裝的「面相」,判斷其真實的內在,這將對人類社會和我們的生活產生怎樣的影響呢?


1. 從面到內:充滿偏見的面相學


19世紀中葉,美國著名顱相學家塞繆爾·R·韋爾斯在他的暢銷書《觀相學》一書中講過一個小故事:庫比賽到其朋友德蘭戈斯的房子參觀,他在一位女性的畫像前駐足良久,他對德蘭戈斯說:「這個女人很漂亮,對吧?」「確實!」德蘭戈斯回答道,但庫比賽接下來卻斷言說,「她有魔鬼一樣的心,她一定是個壞女人。」


令人驚訝的是,這幅畫像畫的真的是一位臭名昭著的囚犯,她的殘忍和她的魅力一樣聞名遐邇。


有關面相學的論調和實踐最早可以追溯到古希臘。《亞里士多德全集》中曾以拉丁文形式收錄其面相學論文《Physiognomonica》;西漢《禮記》也曾記載人眼位置與其本性之間的關係;宋代相書《麻衣相法》更用人的面貌、五官、骨骼、氣色、體態和手紋等推測吉凶禍福、貴賤夭壽。


《麻衣相法》據說為中國宋朝初期相術大師麻衣道者所著


16世紀的義大利博學家戴拉·波塔力在作品《De Humana Pyhsiognomonia》(1586)中首次系統地描述了人的外貌與性格的映射,將人的個性與自然界的形態進行對比,認為獨特的表徵標誌著某種真實的心性。比如一個虎背熊腰的人,他的性格可能也非常魯莽,用低沉的聲調大叫的人是目空一切的,他的原型像一頭驢。



戴拉·波塔及《De Humana Pyhsiognomonia》中的插畫


在西方,將面相學科學化的嘗試一直沒有斷過。18世紀到19世紀初,面相學被瑞士作家、詩人拉瓦特(Johann Caspar Lavater)的四卷論著推向高潮,拉瓦特繼承並發揚了波塔的思想,他認為「面相學分析的是人格的外在表達形式」:鼻子代表靈敏,脖子代表靈活,下巴意味著淫蕩……他的面相學著述在英國和德國地區廣為流傳,吸引了那個時代的知識分子和大眾眼球,甚至差一點耽誤了達爾文提出進化論。


1831年,放棄神學研究的達爾文來到小獵犬號面試隨船自然學者,就因為「面相不好」被冷落。當時的船長——氣象學家、水文地理學家、英國海軍中將菲茲羅伊讀了拉瓦特的書、自認為懂得面相識人,對達爾文的第一印象很糟,他判斷達爾文的鼻子形狀長得不好,認定他是一個經不起折騰沒有恆心的人。



菲茲羅伊船長與達爾文


到了19世紀,義大利南部因國家暴動而陷入混亂,勞工維勒拉因盜竊被判入獄,死於義大利北部的一家監獄。現代犯罪學之父隆博索(Cesare Lombroso)醫生在用精密儀器分析其遺體之後得出結論——像維勒拉這樣「頭骨存在凹陷」「面部不對稱」的「返祖之人」,具有「天生的犯罪傾向」,也就是說犯罪行為可以被代際遺傳。


現代犯罪學之父Cesare Lombroso(1835-1909)


而在東方,面相術則一直在大師和騙術兩個極端搖擺。19世紀後半葉,晚清名臣曾國藩著寫《冰鑒》,基於情態、氣色、鬚眉、聲音、五行、陰陽等中國傳統元素,系統介紹了面相識人之術,將人的五官形態與人的個性命運對應掛鉤。


他在《鬚眉篇》中寫道:「目者面之淵,不深則不清。鼻者面之山,不高則不靈。口闊而方祿千種,齒多而圓不家食。眼角入鬢,必掌刑名。頂見於面,終司錢穀:此貴徵也。舌肥無官,橘皮不顯。文人有傷左目,鷹鼻動便食人:此賤征也。」不知道,曾老先生每日起床梳洗時,又是怎麼看待鏡中的自己的,會不會由衷地感嘆一聲:好面相?




曾國藩及相人術《冰鑒》


到了20世紀,更精細的數據開始進入面相學。1927年,美國紐約皇后區的一名家庭主婦Snyder夥同情夫殺死了自己的丈夫。在審判過程中,法院請來了一位面相專家對Snyder的臉進行分析,專家用遊標卡尺對其五官進行測量之後,得出結論說:「她的下巴像貓一樣尖銳,說明她具有背叛和忘恩負義的人格特徵;她的面部表情說明她有一種尋歡作樂者的膚淺,慣於沉溺於無限的自我放縱,這种放縱最終會終結在慾望和血腥的狂亂之中!」這個結論曾經引起過全美國的討論,最後Snyder成為了紐約市第一個被送上電椅的女性。



Ruth Snyder


20世紀以來,在其他一些需要觀察人臉、性格評估的領域,面相學甚至還被披上了「科學」的外衣。例如,莫頓研究所(Merton Institute)就使用面試者的面相特徵去為AT&T這樣的大公司提供招聘評估服務。

但無論面相學如何變形,它的核心要義是不變的:利用面部特徵去判斷內在,再從相似的表徵去得到類似的內在判斷。這離不開大量的經驗和對比總結,例如我們遇見一個濃眉大眼,聲如驚雷還有著寬廣臉龐的男人,會下意識地想到他大概是和騰格爾一樣粗獷的人,我們對騰格爾的印象會遷移到其他具有相似特徵的人身上。我認為面相學不論被包裝得多好,都摘不掉「偽科學」及「科學種族主義」的帽子,因為它既無法證實,也無法證偽,在每個人的表徵之下,其實都是一隻「薛定諤的貓」。


2. 從數到內:現代演算法的讀心術


莎士比亞有句名言常被引用:「一千個觀眾眼裡有一千個哈姆雷特。」但是,在演算法的眼裡,哈姆雷特只是一個屬於某一類別的人,一千個演算法里,只能容下一個或者幾個哈姆雷特。


2016年,上海交通大學研究者Xiaolin Wu 和 Xi Zhang使用四種分類器(邏輯回歸、K臨近值、支持向量機和卷積神經網路)及特徵生成機,對1856張人臉照片進行犯罪傾向分析,通過抓取眼內角寬度、鼻唇角角度、嘴角弧度等面部差別性特徵,證明了卷積神經網路能較準確地分類犯罪,正確率達89.51%,而且犯罪組的面部特徵顯著異於非犯罪組。然而隨後,也傳來各領域專業團隊的質疑之聲,包括Google數據團隊、華盛頓大學生物學教授組等,主要質疑點包括:照片來源缺乏透明度、無法將表情與面部特徵區分、沒有進行女性的分析等。兩位研究員後來也表示:「我們的研究僅僅是對臉部的社會心理感知,而對於人工智慧演算法預測的這些感知本身的有效性如何,我們的研究並沒有任何結論。」


因為密集的數據正在產生,演算法正在學會「讀心」「猜人」。


2017年7月14日,莫斯科郊外的一棟辦公大樓里,俄羅斯總理梅德韋傑夫與其他俄羅斯內閣成員正認真聆聽精神科臨床教授MichalKosinski的研究分享。這位來自斯坦福大學的36歲青年教授,研究領域包括了技術、人工智慧及大眾心理,據說他在劍橋讀碩士期間的研究成果——用戶在Facebook上的良好活動行為與個人品性之間的關係研究,甚至啟發了赫赫有名的政治數據諮詢公司——劍橋分析(Cambridge Analytica),而後者就是利用了Kosinski的研究成果去幫助特朗普成功入駐白宮。在我的新書《數文明》中,我詳細地闡述了劍橋分析如何用大數據結合心理學解讀大眾的心理、引導美國選民的投票。



斯坦福大學精神科臨床醫生Michal Kosinski教授


就在俄羅斯之行的幾周後,Kosinski就發表了那篇飽受爭議的論文《深度神經網路比人類更能準確從臉部影像判別性取向》。該論文用神經網路分析了35326張交友網站照片,包括18~40歲之間的17641名男性和17685名女性,結果判斷男性和女性是否為同性戀的正確率分別高達81%和71%,而當同一個人的分析照片達到5張,正確率可達91%和83%。



Kosinski論文中的圖片獲取和描述性統計分析表



利用不同面部特徵對男女性取向的判斷正確率(提供了5張照片的樣本分析結果)


不過這項研究也因為研究過程的不嚴謹飽受詬病,包括照片選取是否中立、演算法評測方法是否有效、Kosinski是否用過自己的照片進行測評等。


面對質疑,Kosinski的態度也有所轉變,承認「想要核實研究結果的正確性,我們還必須進行更多的研究」。


還有人發現了獨特的視角。2018年4月份,SabrinaHopper、TobiasLoetscher等四位研究者合作了一篇名為《從日常眼球運動預測個人性格》的論文,針對面相學進行了更加細緻入微的研究。他們通過跟蹤42名參與者的眼球運動,搜集了大量細微的眼球運動數據,再利用隨機森林和決策樹演算法,成功預測了五大人格(OCEAN , Gordon W.Allport , 1897~1967)特徵中的四個(神經過敏型、外向型、愉悅型和負責型)。


數據可靠地揭示了眼球運動與個人性格之間的強相關關係,而且搜集過程來源於被研究者的日常生活,擺脫了實驗室搜集產生的環境干擾。論文的結論說明,在無約束現實環境中,人的眼球運動完全可以預測他的人格特徵。但論文也存在缺陷,主要在於它的實用性還不足以投入現實場景應用,同時由於數據樣本有限,也影響了預測結果的擴展範圍。


我認為,不論這些學者的研究結果多麼漂亮,但都離不開兩個關鍵問題。


其一,樣本的選取質量都非常糟糕。Kosinski的研究中,大量樣本採集於社交網站,這就帶來一個問題——無法排除照片發布者的交友需求主動性,也就是說,男性可能會公布更具雄性魅力的照片,而同性戀者公布的交友照片可能會更加陰柔。而眼球預測人格的研究同樣不靠譜,總共只有42名參與者,5大人格分類又極粗糙,籃筐越大,投籃命中率自然就越高,這樣的相關性本身並不科學。

其二,不論這些研究用了多麼巧妙、先進的技巧和設計,都無法擺脫來自演算法的「偏見」,這個「偏見」可能來自樣本本身,也可能來自研究者本人的特徵選取。


因此,跟「以貌取人」類似,演算法也是戴著「有色眼鏡」來看我們的內心的。


3. 傲慢與偏見:人與演算法的共性


在言必稱數據的時代,人們不但對自己的同胞帶有偏見,數據也可能產生偏見。很多人認為,從數據得到的結果就是科學,就是客觀,就是實實在在的證明和依據。這種唯數據至上論,唯數據可信論,其實就是一種「偏見」。


我們要記住,數據就像比基尼,永遠只給我們揭示部分事實,所謂的大數據,再大也只是世界的一個側面。


演算法會產生獨到的偏見。比如,亞馬遜的招聘AI演算法就更偏好具有男性特徵的簡歷,而對女性面試者不友好,因為在演算法的訓練數據中,男性要多於女性。美國法院使用的人工智慧程序也對黑人的再犯罪判定具有偏見,認為黑人的再犯罪可能性是白人的兩倍,從而影響法院對不同人種的刑期判定;在金融風控方面,AI演算法的結果也對人的種族、階層存有偏見,比如,深色人種即使品行端正也很難申請到住房貸款,因為演算法會將他與那些大多工作不穩定且有犯罪前科的深色人種歸為同類。


產生偏見的原因在於,演算法對人的認識幾乎是即時的,沒有時間維度。也就是說,只要我們的特徵維度不變,那麼同一個演算法永遠都會將我們歸於固定的某一類,問題是人某一個時刻展現的只是自己的一面,更重要的是人是在不斷發展變化中的,青年時期、中年時期、晚年時期,可能呈現完全不同的風格。為什麼人識人就不會這麼刻板,是因為人對人的認識,是一個緩慢的、漸進的、主觀的、挖掘的過程,時間會不斷修正初始的看法和認識,因而人對人的評價會逐步趨向客觀和真實。


努德海文(Nooderhaven)的人性內核分裂模型,將「信任」加入到「經濟人假設」中,認為隨著人與人之間交往與合作的次數增加,「信任」的成分將會越來越大,最終人與人之間的偏見將會隨著信任的增加而軟化。



努德海文人性內核分裂模型

回到前面的故事,達爾文因為「鼻子長的不好」,引起菲茲羅伊船長最初對他的不滿,但後來菲茲羅伊也逐漸認可了達爾文,雖然兩人時有衝突,但菲茲羅伊還是支持了達爾文後續的科學考察。對此,達爾文曾在自傳中寫道:「我的表現與通過我的鼻子做出的預測相反,對此我很滿意」。達爾文後來專門搜集了各類人種的幾千張人臉照片,著書立說反駁面相學。


演算法就像一個成長的嬰孩,人類用源源不斷的數據去餵飽它,它學會了下棋、學會了對話、學會了分類、學會了預測、學會了觀察還學會了人類的偏見。


顯然,演算法無法理解「形相雖惡而心術善,無害為君子也」,很多場景下,演算法無法做到「無偏」和客觀公正,大數據追求的是相關關係,而非因果關係,就像我們開篇提到的南開大學那項研究,臉寬的銀行行長銀行績效好的概率會比較高,因此臉寬和績效之間呈正相關關係,但絕非直接因果。


在大數據分析中,我們可以看到一種趨勢,一個結果,這就如同照鏡子,你和鏡子里的人只存在相關性,即使開槍把鏡子打碎了,人也沒事,如此而已。過分強調因果,只會催生數據時代的「新玄學」,這才是百年名校上熱搜的原因所在。


如此說來,我們雖然體力不如動物,腦力不如演算法,但我們作為文明的創造者,我們天生的動物本質和主觀能動性仍將在數文明的時代熠熠生輝。


說到底,人心難測,並不是什麼壞事,數據和計算如果是萬能的上帝,有什麼疑問只有諮詢一下電腦,那哪裡還有詩歌、小說,電影,想像、愛情的生存空間?沒有了惡,善良就不會那麼寶貴,沒有恨,愛又有多少滋味,一個循規蹈矩、按部就班的世界,又會有什麼意思呢


作者郵箱:tuzipei@vip.163.com


作為一個「知名哈哈哈博主」


每天最要緊的當然是「隨薪所欲」


2018虎Cares新款原創帽衫

挺括版型&重磅面料升級&文案搶眼


走上街你就是最酷炫的男孩/女孩

¥199,數量不多,搶購請早????

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 虎嗅APP 的精彩文章:

Stayreal不二良:大家穿寫有我們logo的T恤,不代表什麼
360金融申請上市,鬥士周鴻禕的孤獨旅行

TAG:虎嗅APP |