CVPR 2018:用GAN預測20年後你長什麼樣
新智元 今天
新智元編譯
來源:sciencemag.org
編譯:肖琴
【新智元導讀】20年後的你長什麼樣?北京航空航天大學和密歇根州立大學的研究人員設計了一個AI系統,採用生成對抗網路(GAN),可以根據原始照片生成一個人年齡增長後的樣子,甚至連髮際線逐漸後移也能逼真地模擬。論文發表在CVPR 2018。
論文:https://arxiv.org/pdf/1711.10352.pdf
警方要搜尋一個失蹤多年的人或逃犯時,有時候線索只有一張舊照片。藝術家或計算機程序可以嘗試根據舊照片推測這些人今天的樣子,但這兩種方法都有缺陷。現在,科學家們已經能夠利用AI來渲染照片中的人年老後的樣子,其結果比以往的方法更加逼真。
來自北京航空航天大學和密歇根州立大學的研究人員設計了這樣一個系統。該系統採用一種由兩個部分組成的演算法,即生成對抗網路(GAN)。第一部分以一張臉的照片作為輸入,並生成目標年齡的同一個人年齡增長後的臉。在訓練過程中,第二部分將生成的圖像與該年齡的人的真實圖像和原始圖像進行對比,並提供反饋,以令第一部分改進生成圖像的效果。
圖1:年齡增長(ageing)的模擬結果(第1列是輸入的圖像)。
其他這類系統也有使用GAN的, 但這個系統的不同之處在於它不僅關注年齡的正確性,還關注保持特定人的身份。與其他系統不同的是,它還能渲染前額和髮際線逐漸升高的樣子,如上圖演示的結果。
圖2:提出的年齡增長方法的框架。
在這個框架中,一個基於CNN的生成器G學習年齡變化(age transformation)。訓練中的critic在圖像空間加入平方歐幾里得損失,GAN loss鼓勵生成的人臉與訓練中相應年齡的老年人的臉無法區分,以及 identity preservation loss使高級特徵表示的輸入輸出距離最小化。
這個研究的主要貢獻如下:
- 提出了一種新的
基於GAN
的年齡發展方法,該方法結合了人臉驗證和年齡估計技術,從而解決了衰老效果生成和身份線索保存的問題。
- 強調了
前額和頭髮的重要性
,這與我們認知的年齡增長現象密切相關,但在其他研究中被忽略了;這確實提高了所生成的衰老照片的精度。
- 除了現有的實驗外,研究者還設置了
新的驗證實驗
,包括基於商業化的面部分析工具的評估以及對錶情、姿勢和化妝變化的不敏感性評估。該方法不僅被證明有效,而且對於年齡增長也具有穩健性。
24個不同的受試者在CACD資料庫上獲得的老化效果(Aging effects)。每個部分的第一個圖像是原始的人臉圖像,隨後的3個圖像是該受試者在[31- 40]、[41-50]和50+年齡組的變老圖像。
圖:24個不不同的受試者在MORPH資料庫獲得的老化效果。
研究人員在來自兩個資料庫的10萬張圖像上訓練了他們的AI,這些資料庫中包括不同年齡的警方存檔的面部照片和名人照片。然後,研究者用一個獨立的計算機程序判斷AI在一組新圖像上的表現。舉例來說,當AI將人的照片老化20年以上時,原本30歲以下的人看起來應該在50歲至60歲之間,計算機程序將他們(平均)視為60歲(面部照片)或52歲(名人照片)。
圖:與先前工作的對比
在進一步的統計調查中,研究人員從已發表的論文中收集了54個人的138張配對的照片,並邀請10位人類觀察者來評估哪張年齡增長的臉更好。在1380票中,69.78%投給了我們的工作,20.80%投給了以前的工作,9.42%表示兩者不分上下。此外,該方法不需要像以前的工作那樣進行繁瑣的預處理,只需要兩個標誌點用於瞳孔對齊。總而言之,研究者稱他們提出的方法優於以前的方法。
相關論文發表在本月的CVPR 2018會議上。
※圖靈獎得主Raj Reddy:不存在通用AI,但未來會出現超智能
TAG:新智元 |