總統踹門、女神下海，AI 帶來了多少以假亂真的可能？

科技 12-17

最近，一段以「神奇女俠」扮演者蓋爾·加朵為「主角」的色情短片在網路上開始流傳。

女神下海是所有宅男的夢想，大多數人只能心裡想想，但有的技術宅卻靠自己的雙手解決了這個問題。最近，一段以「神奇女俠」扮演者蓋爾·加朵為「主角」的色情短片在網路上開始流傳，仔細看就會發現，蓋爾·加朵的臉只是被「換」到了別人身上，視頻的主角並不是女神本人。

這段視頻出自國外 Reddit 論壇，作者是一位叫 deepfakes 的網友，除了「神奇女俠」蓋爾·加朵，他的作品還有很多，艾瑪·沃特森（赫敏）、麥茜·威廉姆斯（二丫）、斯嘉麗·約翰遜（黑寡婦）均在其中，這些視頻都是用 AI 技術輔助合成的。

這不是尖端技術，用開源項目就可以實現

沒有人可以百分百模仿別人的臉，即使是日本成人電影中的波多野結衣、東尼大木，也只是某個角度和明星相似，再加上網友的惡搞，才在網上流行起來。這次「移花接木」的蓋爾·加朵視頻不是模仿秀，也不是複雜的 CG 技術，只是靠現有的 AI 開源項目，用機器學習進行大量訓練，然後合成了色情短片。

deepfakes 不是專業的研究人員，只是對機器學習感興趣，他所用的技術全部基於 TensorFlow、Keras 等開源軟體。deepfakes 用 Google 圖片搜索、公開的圖庫和 YouTube 視頻搜集了大量圖像，然後用這些素材訓練深度學習網路。經過反覆的訓練，系統就可以識別出蓋爾·加朵的正確圖像，演算法會自動將其他圖像變得和訓練對象更相似。

deepfakes 在 Reddit 中提到，他使用的演算法和前段時間英偉達用來改變天氣的技術類似。英偉達使用的是生成式對抗網路（GAN），這種模型擅長處理視覺數據，所生成的圖像更銳利、清晰。英偉達用這個技術可以將晴天的視頻轉換成雨天，以此來欺騙視覺。

有 AI 行業的研究人員表示，這已經不再是尖端技術，用消費級顯卡處理這種效果只需要幾個小時。

如何讓女神的細節更完美？

仔細看這段視頻，會發現蓋爾·加朵的臉並不是和身體完美貼合，偶爾還是會有錯位、失真的現象，有時候聲音和口型也對不上。考慮到只是一個程序員的個人作品，能達到這樣的程度已經很讓人震撼。

機器學習需要大量素材來訓練，即使是選擇名人作為訓練對象，在面部表情上也無法做到盡善盡美，Face2Face 可以解決這些細節問題。利用面部追蹤技術，可以將真人的面部細節複製到已有的視頻中，利用它可以製造大量具有表情細節的視頻素材。

如果我們再多一點「野心」，口型對應的問題可以解決嗎？答案是肯定的。

華盛頓大學的研究人員開發出一種新的演算法，可以將人說話的聲音轉化為對應嘴型，然後將其移植到一個現有的視頻素材中，生成一段全新的視頻，視頻中人說話時嘴唇的動作幾乎和聲音完美對應。

研究人員使用的素材是奧巴馬，因為深度學習的演算法需要有大量數據做支撐，而他的視頻在網上有較多的素材，機器學習會更容易實現。據研究人員透露，整個學習過程需要用 17 個小時的視頻作為訓練素材。從技術上講，完全可以把任何人的聲音安插到其他人的臉上。

（視頻連接??http://t.cn/RKToMLG）

視頻中左邊是原版的視頻。右邊是經過演算法合成的新視頻，用的還是左邊視頻中的聲音，但圖像是全新生成的。

口型的問題解決了，這樣我們會得到一個由蓋爾·加朵的臉、色情女星的身體和聲音組成的視頻，並且口型和聲音能夠同步。當然，熟悉蓋爾·加朵的人肯定會察覺到異樣，畢竟聲音和人不對應。

既然圖像可以創造，那麼聲音呢？

在 2016 年 Adobe Max 大會上，開發人員展示了一款代號為 Project VoCo 的軟體。它和之前的音頻編輯軟體不同，你可以在一段聲音里直接插入和改動某幾個單詞。理論上只要有約 20 分鐘的錄音，Project VoCo 就可以理解一個人聲音的構成並進行複製。也就是說利用它可以生成一段你從未說過，但確實是你聲音的話。

像 Photoshop 一樣編輯聲音的技術並不是空想，一個叫 Descript（https://www.descript.com/）的音頻編輯軟體已經正式推出。將聲音轉化為文字後，你可以通過編輯文本來對音頻進行剪切、複製、粘貼、刪除和插入等操作。當然，可編輯的音頻數量要基於素材的豐富度。

Descript 和 Project VoCo 一樣，能基於已有聲音素材進行編輯，要重新創造一段話還是很難。想要在色情片中聽到完美的聲音還原，還要考慮語氣、情緒等因素影響，不然做出的視頻只能是鬼畜效果。

用 Face2Face 製造有面部表情的視頻素材，用音頻編輯軟體生成聲音素材，然後用 deepfakes 的機器學習系統換臉，並用華盛頓大學研究人員的技術讓聲音和口型對應。這樣，聲音、圖像、表情、口型問題都解決了。

技術難度並不是唯一限制

用技術來還原人物形象的做法在電影中已經出現很多次。《速度與激情 7》中用 CG 技術還原了已經去世的保羅·沃克，《星球大戰外傳：俠盜一號》中還原了彼得·庫欣。這些 CG 技術難度很大，成本也高，AI 技術、機器學習的普及讓製造假視頻變得簡單起來。

前幾年網上流行過一段奧巴馬踹門的視頻，後來被證明是通過剪輯合成的。如果這些場景放到今天用 AI 來實現，恐怕微商們不需要 20 萬也可以和前美國總統合影了。

難度並不是新技術推行的唯一限制，我們更應該考慮的是這些技術被濫用之後，引發的道德、倫理、版權等問題。直播、短視頻等平台生產出大量內容，手機的面部識別功能也開始普及，如果這些數據被人惡意利用，造成對個人、社會的影響是無法估量的。

AI 可以造出女神，也可以造出魔鬼。

頭圖來源：

DeviantArt（http://t.cn/RT6XG69）

編輯：Rubberso

本文由極客公園原創

轉載聯繫 zhuanzai@geekpark.net

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 極客公園 的精彩文章:

※蔚來 ES8 首秀：不只是一輛電動汽車，而是對車的重新定義
※你永遠也想不到一群創客會用 AI 做出些什麼
※三分鐘看懂蔚來 ES8 首秀：李斌要賣給你的不只是一輛電動汽車
※超逼真的 3D 人體解剖模型；AlphaGo 上線教學工具教人下棋；蔚來 ES8 首秀
※蘋果獲可聽、講「耳語」新專利，這能拯救 Siri 尷尬的使用率嗎？

TAG:極客公園 |