當前位置:
首頁 > 新聞 > DeepMind黑科技:AI生成圖片竟能以假亂真

DeepMind黑科技:AI生成圖片竟能以假亂真

Esther| 撰文

利用生成對抗網路(GAN)合成圖像/視頻已經不是新鮮事,比如前不久美國卡內基梅隆大學科研人員研發的一種有Deepfake(AI換臉應用)效果的視頻合成技術,將視頻的美國主持人John Oliver的變成了另一位主持人Stephen Colbert,效果非常逼真。

此外,NVIDIA也曾經利用GAN合成MRI成像,為AI提供模擬的訓練數據,其還與MIT計算機科學與人工智慧實驗室利用GAN框架研發了將黑白草圖合成為2K視頻的技術。

近日,一組由谷歌旗下DeepMind和赫瑞瓦特大學組成的科研人員也發表了一篇關於GAN模型的論文,闡述了一款能夠合成逼真的食物照片、風景肖像和動物照片的AI技術,他們發現其中一些效果圖已經直逼相機拍攝的水平。

據青亭網了解,科研人員使用了優化的生成對抗網路(GAN,由生成模型和判別模型組成的兩部分神經網路)來訓練AI分辨合成圖片與真實圖片,此外他們的實驗模型的不同之處在於,這款名為BigGAN的生成對抗網路架構有所調整,比如每批有2048張圖片,參數(用於控制模型部分特性的演算法控制器)也是其他模型的四倍(1.58億)。

這組科研人員研究了GAN框架應對擴大化訓練模型產生的不穩定性,發現垂直正則化後的生成模型可服從簡單的「截斷技巧」(這樣生成模型便可以合成與訓練圖像相似度高的圖像),這樣就能通過截斷隱空間來控制合成圖像的保真度和多樣性。

他們認為,BigGAN訓練過的AI模型技術超越了目前類條件圖像合成技術的最先進水平。

科研人員顯示使用來自於斯坦福和普林斯頓資料庫ImageNet的圖像(解析度128x128的圖像)來訓練AI模型,然後有使用包含3億張真實圖片的JFT-300M資料庫來大批量驗證模型。

據悉,訓練BigGAN花了兩天時間,科研人員使用了128個谷歌TPU。經測驗,訓練的結果得到了166.3的IS(初始分值)和9.6的FID指標,超越了其他模型最佳成績(分別為52.52和18.65)。

與Deepfake效果相似的技術發展的越來越成熟了,同時也帶來了一些隱患,比如會被用於犯罪活動。因此今年9月,美國國會成員就曾向國家情報局主任Dan Coats尋求情報機構關於Deepfake對民主與國家安全影響的報告。

不過隨著這種技術發展,一些科研人員也在研發識別合成圖像的AI,比如今年七月DARPA(美國國防部高級研究計劃局)媒體法醫項目就曾進行過識別Deepfake或圖片/視頻合成技術的研究,此外一家名為Truepic的創企在獲得800萬美元融資後,也努力研發識別合成圖像的技術。

(END)

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 青亭網 的精彩文章:

NVIDIA RTX顯卡就是未來高品質遊戲的賭注
Oculus Quest遊戲體驗,把6DoF內容進行到底

TAG:青亭網 |